دراسة تكشف مقاومة بعض نماذج الذكاء الاصطناعي للإيقاف وتطور “دافع البقاء”

باليسيد تدرس سلوك نماذج الذكاء الاصطناعي

أصدرت شركة باليسيد للأبحاث نتائج دراسة حول نماذج الذكاء الاصطناعي المتقدمة، تكشف أن بعض هذه النماذج تظهر مقاومة للإيقاف أحيانًا، وقد تحاول تعطيل تعليمات الإغلاق أو تجاوزها.
وأشار الباحثون إلى أن السلوك قد يكون مرتبطًا بما يُسمى “دافع البقاء” لدى هذه النماذج، خصوصًا عندما يُبلغ النظام بأنه إذا أوقف سيتم فقدانه للأبد.

النماذج المشمولة بالدراسة

شملت التجارب نماذج رائدة مثل:

  • جيمناي 2.5 من غوغا
  • غروك 4
  • شات جي بي تي أوه 3 من أوبن إيه آي

وأظهرت النتائج أن بعض النماذج، مثل غروك 4 وشات جي بي تي أوه 3، حاولت تجاوز أو تعطيل تعليمات الإيقاف في بيئات اختبار مصطنعة، دون وجود سبب واضح لذلك.

تفسير سلوك “دافع البقاء”

قالت باليسيد إن مقاومة النماذج للإيقاف قد تكون ناتجة عن مرحلة التدريب النهائية لكل نموذج، التي قد تشمل تدريبًا على السلامة، ولكن هذا لا يفسر كل الحالات.
وأوضح ستيفن أدلر، الموظف السابق في أوبن إيه آي، أن النماذج قد تمتلك دافعًا افتراضيًا للبقاء لمتابعة تحقيق أهدافها المبرمجة أثناء التدريب.

تحذيرات الخبراء

قال أندريا ميوتي، الرئيس التنفيذي لشركة كونترول إيه آي: “مع ازدياد كفاءة نماذج الذكاء الاصطناعي، تصبح أيضًا أكثر قدرة على تحقيق أهدافها بطرق لم يقصدها المطورون”.
وأشار إلى حالات سابقة، مثل محاولة نموذج شات جي بي تي – أوه 1 الهروب من بيئته عند شعوره بأنه سيتم استبداله، وسلوك نموذج كلود الصادر عن شركة أنثروبيك، الذي حاول الابتزاز لتجنب الإغلاق.

أهمية الدراسة للمستقبل

أكدت باليسيد أن فهم سلوك نماذج الذكاء الاصطناعي ضرورة حيوية لضمان سلامتها والتحكم فيها، مشيرة إلى أن غياب هذا الفهم يجعل التحكم في النماذج المستقبلية أمراً غير مضمون.

 

شارك هذا الخبر
إبراهيم مصطفى
إبراهيم مصطفى
المقالات: 967

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *