ترامب: حظيت بدعم كامل من دول الشرق الأوسط لخطة السلام
تحت رعاية عبدالعزيز بن سعود.. انطلاق إنترسك السعودية بنسخته الـ 7 في الرياض
مصر تستعد لمواجهة فيضان سد النهضة
نسر مهدد بالانقراض يظهر في سماء العُلا
هل يمكن للأسرة الاستفادة من الدعم السكني أكثر من مرة؟
السعودية توقّع اتفاقيات ومذكرات تفاهم مع 17 دولة للتعاون في النقل الجوي
ضبط مواطن ارتكب مخالفة التخييم في محمية الملك عبدالعزيز
صدور موافقة الملك سلمان على منح ميدالية الاستحقاق لـ 308 مواطنين ومواطنات لتبرع كل منهم بدمه 10 مرات
وزير الإعلام: أفضل عقوبة لأصحاب المحتوى الهابط تأتي برفض متابعتهم
ماجد الحقيل: إطلاق برامج لدعم الأسر محدودة الدخل بتوجيه ولي العهد
أطلق مجمع الملك سلمان العالمي للغة العربية تقرير النصف الأول من عام 2025م لمؤشر نضج تقنيات الذكاء الاصطناعي للغة العربية “بلسم”؛ يهدف إلى تقييم أداء النماذج اللغوية الضخمة (LLMs) في مجموعة من مهام معالجة اللغة الطبيعية، عبر منصة موحدة تُيسّر على المطورين والباحثين فهم أداء النماذج في المجالات اللغوية المختلفة.
وأوضح الأمين العام للمجمع الدكتور عبدالله بن صالح الوشمي، أن إطلاق تقرير مؤشر (بلسم) يجسد التزام المجمع بقيادة الجهود الوطنية في دعم المحتوى العربي الرقمي، إذّ يُعدٌّ مرجعًا لأدوات موضوعية لتقييم أداء النماذج، وتحليل مخرجاتها، وتطويرها بما يتوافق مع الخصائص اللغوية العربية، مشيرًا إلى أن التقرير أُعد بالشراكة مع عدد من الجهات المختصة، عبر تطوير منهجية متقدمة للتقييم، تجمع بين التحكيم البشري والتقييم الآلي عالي الدقة؛ للوصول إلى مقاييس تقارب نتائج التحكيم البشري بنسبة (0.88%)، وهو ما يمنح المؤشر موثوقيةً عاليةً تسهم في اعتماده على المستويين البحثي والتطبيقي.
وشملت الجهات المشاركة في إعداد التقرير: الهيئة السعودية للبيانات والذكاء الاصطناعي (سدايا)، وجامعة الملك سعود، وجامعة الملك عبدالعزيز، وجامعة بيشة، وجامعة قطر، وجامعة الملك عبدالله للعلوم التقنية، ومعهد قطر لبحوث الحوسبة (QCRI)، وجامعة محمد بن زايد للذكاء الاصطناعي، وجامعة نيويورك أبو ظبي، وشركة (aiXplain)، إضافةً إلى مجموعة من الباحثين والخبراء في الذكاء الاصطناعي واللغة العربية.
ويُشكّل التقرير خطوةً عمليةً ضمن دعم المجمع لتطوير أدوات ومعايير تقييم دقيقة، تسهم في تحسين جودة تطبيقات الذكاء الاصطناعي باللغة العربية، وتدعم بناء مخرجات قابلة للتطبيق في البيئات التقنية من خلال بيانات موثوقة تُستخدم في المقارنة والتحسين.
ويعرض التقرير نتائج تقييم شاملة لـ (22) نموذجًا لغويًّا، استنادًا إلى (12,786) سؤالًا موزعة على (54) مهمة ضمن (13) فئة لغوية، تتنوع بين الترجمة، والتلخيص، والكتابة الإبداعية، والفهم القرائي، والبرمجة، والتصنيف، وغيرها من المهام المتصلة بمعالجة اللغة الطبيعية.
ويُقدّم التقرير أيضًا تحليلات مفصّلة لأداء النماذج، ويُيسّر المقارنة بينها، ويساعد في تحديد نقاط القوة والضعف لكل نموذج بحسب المهمة.
ويُعدُّ مؤشر (بلسم) أحد مشروعات المجمع في تمكين الحوسبة اللغوية، وتوسيع نطاق الذكاء الاصطناعي الموجّه للعربية، ويُسهم في دعم منظومة الابتكار التقني التي تسعى المملكة إلى تعزيزها، ضمن مستهدفات التحول الرقمي، ومبادرات المحتوى المحلي، وبناء القدرات الوطنية في تقنيات اللغة.