أمانة المدينة المنورة تُصدر أكثر من 6000 رخصة وتصريح عبر بلدي خلال شهر
قرار منع “النقطة” بالأعراس يثير الغضب في موريتانيا
رصد مجرة الشبح من نفود المعيزيلة جنوب رفحاء
وزارة الداخلية في مؤتمر ومعرض الحج 2025.. جهود ومبادرات أمنية وإنسانية لخدمة ضيوف الرحمن
مذكرة تفاهم لتأسيس محفظة تنموية بـ300 مليون ريال لخدمة ضيوف الرحمن
بدء إيداع حساب المواطن الدفعة 96
فتح باب التأهيل لمتعهدي الإعاشة في المشاعر المقدسة استعدادًا لموسم حج 1447
تأثير الإغلاق على الاقتصاد الأمريكي يزداد سوءًا
ابتكار عدسة نانوية قادرة على تغيير مستقبل الطب الحديث
الدوري الإنجليزي.. مانشستر سيتي يتغلب على ليفربول بثلاثية نظيفة
أطلق مجمع الملك سلمان العالمي للغة العربية تقرير النصف الأول من عام 2025م لمؤشر نضج تقنيات الذكاء الاصطناعي للغة العربية “بلسم”؛ يهدف إلى تقييم أداء النماذج اللغوية الضخمة (LLMs) في مجموعة من مهام معالجة اللغة الطبيعية، عبر منصة موحدة تُيسّر على المطورين والباحثين فهم أداء النماذج في المجالات اللغوية المختلفة.
وأوضح الأمين العام للمجمع الدكتور عبدالله بن صالح الوشمي، أن إطلاق تقرير مؤشر (بلسم) يجسد التزام المجمع بقيادة الجهود الوطنية في دعم المحتوى العربي الرقمي، إذّ يُعدٌّ مرجعًا لأدوات موضوعية لتقييم أداء النماذج، وتحليل مخرجاتها، وتطويرها بما يتوافق مع الخصائص اللغوية العربية، مشيرًا إلى أن التقرير أُعد بالشراكة مع عدد من الجهات المختصة، عبر تطوير منهجية متقدمة للتقييم، تجمع بين التحكيم البشري والتقييم الآلي عالي الدقة؛ للوصول إلى مقاييس تقارب نتائج التحكيم البشري بنسبة (0.88%)، وهو ما يمنح المؤشر موثوقيةً عاليةً تسهم في اعتماده على المستويين البحثي والتطبيقي.
وشملت الجهات المشاركة في إعداد التقرير: الهيئة السعودية للبيانات والذكاء الاصطناعي (سدايا)، وجامعة الملك سعود، وجامعة الملك عبدالعزيز، وجامعة بيشة، وجامعة قطر، وجامعة الملك عبدالله للعلوم التقنية، ومعهد قطر لبحوث الحوسبة (QCRI)، وجامعة محمد بن زايد للذكاء الاصطناعي، وجامعة نيويورك أبو ظبي، وشركة (aiXplain)، إضافةً إلى مجموعة من الباحثين والخبراء في الذكاء الاصطناعي واللغة العربية.
ويُشكّل التقرير خطوةً عمليةً ضمن دعم المجمع لتطوير أدوات ومعايير تقييم دقيقة، تسهم في تحسين جودة تطبيقات الذكاء الاصطناعي باللغة العربية، وتدعم بناء مخرجات قابلة للتطبيق في البيئات التقنية من خلال بيانات موثوقة تُستخدم في المقارنة والتحسين.
ويعرض التقرير نتائج تقييم شاملة لـ (22) نموذجًا لغويًّا، استنادًا إلى (12,786) سؤالًا موزعة على (54) مهمة ضمن (13) فئة لغوية، تتنوع بين الترجمة، والتلخيص، والكتابة الإبداعية، والفهم القرائي، والبرمجة، والتصنيف، وغيرها من المهام المتصلة بمعالجة اللغة الطبيعية.
ويُقدّم التقرير أيضًا تحليلات مفصّلة لأداء النماذج، ويُيسّر المقارنة بينها، ويساعد في تحديد نقاط القوة والضعف لكل نموذج بحسب المهمة.
ويُعدُّ مؤشر (بلسم) أحد مشروعات المجمع في تمكين الحوسبة اللغوية، وتوسيع نطاق الذكاء الاصطناعي الموجّه للعربية، ويُسهم في دعم منظومة الابتكار التقني التي تسعى المملكة إلى تعزيزها، ضمن مستهدفات التحول الرقمي، ومبادرات المحتوى المحلي، وبناء القدرات الوطنية في تقنيات اللغة.