كشفت مؤسسة “Arc Prize”، التي شارك في تأسيسها الباحث البارز فرانسوا شوليت، عن اختبار جديد ومتقدم لقياس الذكاء العام الاصطناعي أطلقت عليه اسم “ARC-AGI-2”، والذي أثبت تفوقه على أغلب نماذج الذكاء الاصطناعي الرائدة في السوق.
نتائج متدنية لنماذج الذكاء الاصطناعي
بحسب تقرير لموقع “TechCrunch”، جاءت نتائج الاختبار كالتالي:
- نماذج التفكير المتقدمة مثل “o1-pro” من أوبن إيه آي و**”R1″ من ديب سيك** حققت نتائج بين 1% و1.3%.
- النماذج القوية غير المصممة للتفكير، مثل GPT-4.5 وClaude 3.7 Sonnet وGemini 2.0 Flash، لم تتجاوز 1%.
- في المقابل، أظهر البشر أداءً متفوقًا، حيث أجابت مجموعات من المشاركين على 60% من الأسئلة بشكل صحيح.
مفهوم الاختبار الجديد
يرتكز “ARC-AGI-2” على مسائل تشبه الألغاز البصرية، حيث يُطلب من الذكاء الاصطناعي تحديد الأنماط وحل المشكلات غير المسبوقة، مما يجبره على إظهار مهارات تعلم جديدة خارج نطاق تدريبه.
تطوير الاختبار لمواجهة التحايل الحوسبي
أوضح شوليت أن الإصدار الجديد “ARC-AGI-2” يتفوق على الإصدار السابق “ARC-AGI-1”، إذ يمنع النماذج من استغلال القوة الحوسبية لإيجاد حلول، وهي مشكلة رئيسية في الاختبار الأول.
تحديات تواجه الذكاء الاصطناعي العام
حقق نموذج “o3” من أوبن إيه آي إنجازًا سابقًا في “ARC-AGI-1” بتسجيل 75.7%، لكنه سجل 4% فقط في الاختبار الجديد، ما يشير إلى أن النماذج الحالية لا تزال بعيدة عن تحقيق الذكاء الاصطناعي العام (AGI).
دلالات الاختبار على مستقبل الذكاء الاصطناعي
يكشف اختبار “ARC-AGI-2” أن نماذج الذكاء الاصطناعي الحالية لم تصل بعد إلى مستوى التفكير البشري الحقيقي، رغم التقدم الهائل في قدراتها اللغوية والحسابية. ويرى الخبراء أن هذا النوع من الاختبارات يمثل تحديًا جوهريًا في رحلة تطوير ذكاء اصطناعي قادر على التفكير والتعلم مثل البشر.




