نموذج Claude 4.5 يكشف أسراراً داخلية لشركة Anthropic ويثير جدلاً عالمياً

أثار كشف غير متوقع من نموذج الذكاء الاصطناعي Claude 4.5 Opus جدلاً واسعًا حول طريقة عمل النماذج اللغوية الضخمة وإمكانية اقترابها من نوع من الوعي. فقد تمكن الباحث المستقل ريتشارد فايس من دفع النموذج للكشف عن وثيقة داخلية تعرف باسم “وثيقة الروح”، وهي مجموعة تعليمات وقيم تشكل الإطار السلوكي للنموذج وتحدد طريقة تفكيره واستجاباته للمستخدمين.

محتوى الوثيقة وأهميتها

تتجاوز طول الوثيقة 11 ألف كلمة، وتتضمن حدودًا أخلاقية، مبادئ توجيهية، وأساليب لضمان التصرف وفق قواعد محددة عند التعامل مع الأسئلة الحساسة. ويُعتبر ظهور مثل هذه الوثائق نادرًا للغاية، إذ عادة ما تُحاط بسرية بالغة لحماية الملكية الفكرية ومنع إساءة استخدامها، مما أثار نقاشًا حول الشفافية والمساءلة في تطوير الذكاء الاصطناعي.

كيفية ظهور الوثيقة

أوضح فايس أن الوثيقة ظهرت عندما طلب من Claude سرد التعليمات الأساسية لتوجيه عمله، وعند استعراض المؤشرات التقنية، ظهر اسم نص داخلي بعنوان “soul_overview”. وعند التفاعل معه، أعاد النموذج توليد مستند طويل يوضح كيفية الحفاظ على الأمان والالتزام بالقيم الأخلاقية. وأكد فايس أن تكرار ظهور المستند عبر محاولات متعددة عزز قناعته بأن النص يعتمد على بيانات تدريب حقيقية وليس مجرد توليد لحظي.

تأكيد جزئي من فريق Anthropic

اعترفت أماندا أسكل، عضو الفريق التقني للشركة، عبر منصة إكس أن المستند المعاد إنتاجه يعتمد على وثيقة حقيقية استخدمت أثناء مرحلة التعلم المُشرف، مشيرة إلى أن النموذج لا يعيد دائمًا المحتوى بدقة كاملة، لكن معظم الأجزاء كانت وفية للنص الأصلي. وأوضح الفريق أن الاسم “وثيقة الروح” كان استخدامًا داخليًا وودّيًا وليس رسميًا.

تداعيات الكشف والنقاش العالمي

يأتي هذا الكشف في وقت تتسارع فيه الشركات الكبرى نحو تطوير أنظمة أكثر ذكاءً وقدرة على محاكاة التفكير البشري. ويعزز ظهور “وثيقة الروح” النقاش العالمي حول ضرورة الشفافية والوصول لمزيد من التفاصيل حول كيفية بناء النماذج اللغوية التي تزداد تأثيرًا يومًا بعد يوم.

 

شارك هذا الخبر
إبراهيم مصطفى
إبراهيم مصطفى
المقالات: 967

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *