"أنثروبيك" تطلق "Claude Opus 4.1" بأداء قياسي يتفوّق على نماذج OpenAI وجوجل

نموذج الذكاء الاصطناعي الجديد يسجّل 74.5% في اختبار SWE-bench ويتصدّر سباق البرمجة

أعلنت شركة أنثروبيك (Anthropic) الناشئة في مجال الذكاء الاصطناعي، عن إطلاق نسخة مُحسّنة من نموذجها الرئيسي، تحت اسم “Claude Opus 4.1”، والذي حقق أداءً غير مسبوق في اختبارات هندسة البرمجيات، في خطوة تهدف إلى ترسيخ موقع الشركة في سوق أدوات البرمجة المدعومة بالذكاء الاصطناعي، قبل التحديات المرتقبة من منافستها الأكبر “OpenAI”.

أداء قياسي في اختبار SWE-bench

بحسب بيان صادر عن “أنثروبيك” يوم الثلاثاء، سجّل النموذج الجديد نسبة 74.5% في اختبار “SWE-bench Verified”، وهو معيار مُعتمد يقيس قدرة أنظمة الذكاء الاصطناعي على حل مشكلات حقيقية في مجال هندسة البرمجيات.

وبهذا الأداء، يتفوّق “Claude Opus 4.1” على أحدث نماذج المنافسين، بما في ذلك نموذج “O3” من OpenAI الذي سجّل 69.1%، و**”Gemini 2.5 Pro” من غوغل** الذي أحرز 67.2%، ما يعزز تفوّق “أنثروبيك” في ميدان البرمجة الدقيقة والمهام الوكيلة المعقدة.

تطور ملحوظ مقارنة بالإصدارات السابقة

كشفت “أنثروبيك” أن “Claude Opus 4.1” يرفع دقة البرمجة مقارنة بنموذج “Claude Opus 4″ الذي أحرز 72.5%، و”Claude Sonnet 3.7” الذي حقق 62.3% في نفس الاختبار، مما يعكس تحسنًا ملحوظًا في قدرات النموذج خلال فترة زمنية قصيرة.

تركيز على الاستدلال والبحث الوكلي

وقالت الشركة إن النسخة الجديدة تتميّز بقدرات محسّنة في مجالات مثل الاستدلال المنطقي، وتحليل البيانات المعقّدة، وتتبّع التفاصيل الدقيقة في سياقات متعددة، مع قدرات بحث متقدمة تلائم سيناريوهات “المهام الوكيلة”، وهو مجال بات يحظى بأهمية متزايدة في تطبيقات الذكاء الاصطناعي الواقعي.

توقيت الإطلاق يسبق GPT-5 من OpenAI

يتزامن هذا الإطلاق مع استعدادات شركة “OpenAI” للكشف عن نموذجها المرتقب GPT-5، ما أثار تساؤلات بين المراقبين حول ما إذا كانت “أنثروبيك” تسابق الزمن لتثبيت موقعها في الصدارة، أم أنها استبقت المنافسة بمنتج جاهز بالفعل.

وبالرغم من أن التوقيت قد يوحي ببعض الاستعجال، إلا أن النتائج المعلنة تشير إلى أن النموذج الجديد قد تجاوز بالفعل منافسيه في المهام البرمجية، ما يضع OpenAI أمام تحدٍّ حقيقي في هذا المجال.

توافر واسع عبر منصات كبرى

أكدت “أنثروبيك” أن “Claude Opus 4.1” أصبح متاحًا بدءًا من يوم الثلاثاء، من خلال أدوات Claude Code، وواجهة برمجة التطبيقات API الخاصة بالشركة، إضافة إلى منصات Amazon Bedrock، وVertex AI التابعة لشركة غوغل، مما يسهل الوصول إلى النموذج عبر بيئات تطوير مختلفة.

“أنثروبيك” تطلق “Claude Opus 4.1” بأداء قياسي يتفوّق على نماذج OpenAI وجوجل

أداء قياسي في اختبار SWE-bench

تطور ملحوظ مقارنة بالإصدارات السابقة

تركيز على الاستدلال والبحث الوكلي

توقيت الإطلاق يسبق GPT-5 من OpenAI

توافر واسع عبر منصات كبرى

إبراهيم شعبان

اترك ردّاًإلغاء الرد

صفقات إنفيديا الضخمة تعيد الجدل حول التمويل الدائري ...

غضب واسع في أمريكا بعد دعوى جديدة ضد ChatGPT.. اتهام...

إنفيديا تبحث تقديم ضمانات بـ250 مليار دولار لدعم مشر...

تشات جي بي تي يدخل المحادثات اليومية.. تعرف على التف...

الذكاء الاصطناعي يغيّر طبيعة العمل بوتيرة أسرع من اس...

أداء قياسي في اختبار SWE-bench

تطور ملحوظ مقارنة بالإصدارات السابقة

تركيز على الاستدلال والبحث الوكلي

توقيت الإطلاق يسبق GPT-5 من OpenAI

توافر واسع عبر منصات كبرى

إبراهيم شعبان

اترك ردّاًإلغاء الرد

مقالات مشابهة