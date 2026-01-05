أكدت دراسة حديثة الدور المحوري للنماذج اللغوية العربية الكبيرة في تمكين حضور اللغة العربية في الفضاءات الرقمية وتعزيز قدرتها على المنافسة عالميًا، بما يدعم حضور اللغة العربية في البيئة الرقمية، ويسرّع تبنّي الابتكار في المؤسسات، مبينة تصدر المملكة قائمة الدول المطوّرة للنماذج اللغوية العربية عام 2025.

وسعت الدراسة التي أجرتها الهيئة السعودية للبيانات والذكاء الاصطناعي “سدايا”، بالتعاون مع مجمع الملك سلمان العالمي للغة العربية، إلى دعم تطوير منظومة الذكاء الاصطناعي باللغة العربية، وتحديد متطلبات تطوير نماذج أكثر قدرة على فهم اللغة العربية ولهجاتها المتنوعة، وتوليد المحتوى وتنفيذ التعليمات.

وتناولت الدراسة تاريخ تطور النماذج اللغوية العربية منذ بداياتها اعتمادًا على الأنظمة القائمة على القواعد قبل عام 2000م، مرورًا بالنماذج الإحصائية والشبكات العصبية، وصولًا إلى مرحلة النماذج اللغوية الكبيرة وتطبيقاتها التوليدية المعاصرة خلال الفترة من 2022 حتى 2025م، حيث شهدت هذه المرحلة إطلاق عشرات النماذج العربية، من بينها نماذج حوارية وأخرى توليدية موجّهة لدعم الاحتياج العربي في المجالات التقنية والتعليمية والمعرفية.

ورصدت الدراسة أكثر من (53) نموذجًا لغويًا عربيًا حتى الربع الأول من عام 2025م، وتصدرت المملكة العربية السعودية قائمة الدول المطوّرة لهذه النماذج؛ بينما أبدت جهات دولية اهتمامًا ملحوظًا بتطوير نماذج لغوية داعمة للغة العربية، وأظهرت التحليلات ضعف الاستثمار في النماذج اللغوية العربية الداعمة للصيغ الصوتية والبصرية، رغم أهميتها المستقبلية، إذ كانت (81%) من هذه النماذج أحادية الوسائط وتتعامَل مع النصوص فقط، فيما كانت نسبة النماذج متعددة الوسائط (7%).

أما من ناحية القدرات، فقد أوضحت الدراسة أن النماذج اللغوية العربية تضمنت ثلاث مهام رئيسية، وهي: فهم اللغة، وتوليد المحتوى، والمحادثة وتنفيذ التعليمات؛ بينما لا تزال القدرات المعرفية والاستدلالية وتعدد اللغات والدعم البرمجي منخفضة المستوى مقارنة بالنماذج اللغوية العالمية.

ووفقًا لنتائج تقييم المقياس المعياري (بلسم) الصادر عن مجمع الملك سلمان العالمي للغة العربية التي تقارن أداء النماذج اللغوية العربية بنظيراتها العالمية في المهام اللغوية العربية، فقد أظهرت تفوق النماذج العالمية في أغلبية فئات المهارات اللغوية، وعكست في الوقت ذاته النتائج نقاط قوة واعدة لبعض النماذج العربية في بعض المهام النوعية، وتفوقت بشكل طفيف في مهارة التلخيص، فيما قدمت أداءً مقاربًا في مهام الكتابة الإبداعية والفهم القرائي.

واستعرضت الدراسة الوضع الراهن للنماذج العربية، مشيرةً إلى وجود نماذج مطوّرة في دول عربية أبرزها المملكة العربية السعودية والإمارات، إضافةً إلى نماذج طُوِّرت في جهات دولية داعمة للغة العربية، وكشفت عن وجود فجوات أبرزها محدودية أحجام النماذج وعدد معاملاتها مقارنة بالنماذج العالمية، وافتقار البيانات العربية الشاملة، وندرة المقاييس المرجعية العربية المتخصصة في تقييم الأداء.

ووضعت الدراسة خارطة طريق توضّح خطوات عملية لتحقيق الريادة للنماذج اللغوية العربية الكبيرة، من خلال التركيز على توفير البيانات العربية بجودة عالية وشمولية لمختلف اللهجات والمجالات، وتطوير نماذج لغوية متعددة القدرات وأحجام متنوعة، وبناء مقاييس مرجعية عربية لتقييم جودة النماذج، بالإضافة إلى دعم تبنّي النماذج العربية محليًا عبر المؤسسات الحكومية والخاصة، ونشرها للاستخدام المجتمعي.

وتأتي هذه الدراسة في إطار التعاون بين “سدايا” ومجمع الملك سلمان العالمي للغة العربية، كخطوة نوعية تعكس اهتمام المملكة بالجمع بين الهوية اللغوية والثقافية والتطور التقني، والعمل على ضمان حضور اللغة العربية في منظومة الذكاء الاصطناعي العالمية، بما يعزّز هذا التعاون مكانة المملكة باعتبارها مركزًا إقليميًا رائدًا في تطوير تقنيات اللغة العربية وتمكين المحتوى العربي الرقمي.