“أنثروبيك” تطلق “Claude Opus 4.1” بأداء قياسي يتفوّق على نماذج OpenAI وجوجل

نموذج الذكاء الاصطناعي الجديد يسجّل 74.5% في اختبار SWE-bench ويتصدّر سباق البرمجة

أعلنت شركة أنثروبيك (Anthropic) الناشئة في مجال الذكاء الاصطناعي، عن إطلاق نسخة مُحسّنة من نموذجها الرئيسي، تحت اسم “Claude Opus 4.1”، والذي حقق أداءً غير مسبوق في اختبارات هندسة البرمجيات، في خطوة تهدف إلى ترسيخ موقع الشركة في سوق أدوات البرمجة المدعومة بالذكاء الاصطناعي، قبل التحديات المرتقبة من منافستها الأكبر “OpenAI”.

أداء قياسي في اختبار SWE-bench

بحسب بيان صادر عن “أنثروبيك” يوم الثلاثاء، سجّل النموذج الجديد نسبة 74.5% في اختبار “SWE-bench Verified”، وهو معيار مُعتمد يقيس قدرة أنظمة الذكاء الاصطناعي على حل مشكلات حقيقية في مجال هندسة البرمجيات.

وبهذا الأداء، يتفوّق “Claude Opus 4.1” على أحدث نماذج المنافسين، بما في ذلك نموذج “O3” من OpenAI الذي سجّل 69.1%، و**”Gemini 2.5 Pro” من غوغل** الذي أحرز 67.2%، ما يعزز تفوّق “أنثروبيك” في ميدان البرمجة الدقيقة والمهام الوكيلة المعقدة.

تطور ملحوظ مقارنة بالإصدارات السابقة

كشفت “أنثروبيك” أن “Claude Opus 4.1” يرفع دقة البرمجة مقارنة بنموذج “Claude Opus 4″ الذي أحرز 72.5%، و”Claude Sonnet 3.7” الذي حقق 62.3% في نفس الاختبار، مما يعكس تحسنًا ملحوظًا في قدرات النموذج خلال فترة زمنية قصيرة.

تركيز على الاستدلال والبحث الوكلي

وقالت الشركة إن النسخة الجديدة تتميّز بقدرات محسّنة في مجالات مثل الاستدلال المنطقي، وتحليل البيانات المعقّدة، وتتبّع التفاصيل الدقيقة في سياقات متعددة، مع قدرات بحث متقدمة تلائم سيناريوهات “المهام الوكيلة”، وهو مجال بات يحظى بأهمية متزايدة في تطبيقات الذكاء الاصطناعي الواقعي.

توقيت الإطلاق يسبق GPT-5 من OpenAI

يتزامن هذا الإطلاق مع استعدادات شركة “OpenAI” للكشف عن نموذجها المرتقب GPT-5، ما أثار تساؤلات بين المراقبين حول ما إذا كانت “أنثروبيك” تسابق الزمن لتثبيت موقعها في الصدارة، أم أنها استبقت المنافسة بمنتج جاهز بالفعل.

وبالرغم من أن التوقيت قد يوحي ببعض الاستعجال، إلا أن النتائج المعلنة تشير إلى أن النموذج الجديد قد تجاوز بالفعل منافسيه في المهام البرمجية، ما يضع OpenAI أمام تحدٍّ حقيقي في هذا المجال.

توافر واسع عبر منصات كبرى

أكدت “أنثروبيك” أن “Claude Opus 4.1” أصبح متاحًا بدءًا من يوم الثلاثاء، من خلال أدوات Claude Code، وواجهة برمجة التطبيقات API الخاصة بالشركة، إضافة إلى منصات Amazon Bedrock، وVertex AI التابعة لشركة غوغل، مما يسهل الوصول إلى النموذج عبر بيئات تطوير مختلفة.

 

شارك هذا الخبر
إبراهيم شعبان
إبراهيم شعبان

صحفي متخصص في التكنولوجيا

المقالات: 1319

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *