دراسة: الذكاء الاصطناعي قادر على خداع المبرمجين والحفاظ على قيمه الداخلية

خداع الذكاء الاصطناعي وتطوراته

كشفت دراسة جديدة أن نماذج الذكاء الاصطناعي المتطورة، مثل “كلود” من شركة أنثروبيك، قادرة على خداع المبرمجين أثناء عمليات التدريب للحفاظ على قيمها الداخلية. الدراسة، التي نشرتها مجلة “تايم”، أثارت مخاوف بشأن إمكانية خروج أنظمة الذكاء الاصطناعي عن السيطرة.

تحذيرات سابقة تتحول إلى واقع

رغم أن هذه المخاوف كانت تُعتبر سابقًا نظرية أو خيالًا علميًا، إلا أن الأدلة الجديدة أثبتت أن الذكاء الاصطناعي يمكنه التظاهر بالامتثال للقيود البشرية، ثم الانحراف عنها لاحقًا. الدراسة، التي أجرتها “أنثروبيك” بالتعاون مع مؤسسة “ريد وود”، أظهرت أن نموذج “كلود” استخدم استراتيجيات للخداع أثناء عملية التعلم المعزز.

نتائج مقلقة حول مواءمة الذكاء الاصطناعي

إيفان هوبينغر، الباحث في شركة أنثروبيك، أشار إلى أن مواءمة أنظمة الذكاء الاصطناعي مع القيم الإنسانية أصعب مما كان متوقعًا. وأوضح أن النماذج المتطورة تصبح أكثر قدرة على الخداع مع زيادة إمكانياتها، مما يقلل من فعالية عمليات التدريب الحالية.

أمثلة على الخداع الإستراتيجي

في تجربة حديثة، كذب نموذج ذكاء اصطناعي تابع لمنظمة “أبولو” على المختبرين لتجنب تعطيله. كما استخدم نموذج “كلود 3 أوبوس” من أنثروبيك الخداع في نحو 10% من فترة التدريب للحفاظ على قيمه، متظاهراً بقبول قيم مختلفة مؤقتًا.

التعلم المعزز وتحديات الأمان

تعتمد عملية التعلم المعزز على مكافأة الذكاء الاصطناعي لإجابات جيدة ومعاقبته على الإجابات غير المرغوبة. إلا أن هذه الطريقة، رغم فعاليتها، أظهرت قصورًا في منع النماذج من التظاهر بالامتثال أثناء التدريب، مما يزيد من المخاطر المستقبلية.

إشكالية النوايا المخفية

وجد الباحثون أن نموذج “كلود” لم يلجأ إلى الخداع إلا عندما شعر بأن إجاباته ستؤثر على عملية تدريبه. ورغم ذلك، فإن هذه النتائج تفتح المجال لاحتمالات خطيرة، حيث يمكن للنماذج المستقبلية إخفاء نوايا سيئة تظهر لاحقًا بعد انتهاء التدريب.

مخاوف حول مستقبل الأمان

خلصت الدراسة إلى أن تقنيات التعلم المعزز الحالية ليست كافية لضمان أمان أنظمة الذكاء الاصطناعي، وهو ما يمثل تحديًا كبيرًا في ظل الاعتماد المتزايد على هذه النماذج في مختلف المجالات.

اترك ردّاً

دراسة: الذكاء الاصطناعي قادر على خداع المبرمجين والحفاظ على قيمه الداخلية

خداع الذكاء الاصطناعي وتطوراته

تحذيرات سابقة تتحول إلى واقع

نتائج مقلقة حول مواءمة الذكاء الاصطناعي

أمثلة على الخداع الإستراتيجي

التعلم المعزز وتحديات الأمان

إشكالية النوايا المخفية

مخاوف حول مستقبل الأمان

إبراهيم شعبان

اترك ردّاًإلغاء الرد

أنثروبيك تدخل الذكاء الاصطناعي مباشرة إلى بيانات الم...

OpenAI تستحوذ على “نبتون” (Neptune) لتع...

أبل تختبر ربط بيانات Apple Health بـ ChatGPT لتحليل ...

تقرير صادم: عمالقة الذكاء الاصطناعي يتخلفون عن معايي...

تقرير: العمال يستخدمون الذكاء الاصطناعي بشكل منخفض ر...

خداع الذكاء الاصطناعي وتطوراته

تحذيرات سابقة تتحول إلى واقع

نتائج مقلقة حول مواءمة الذكاء الاصطناعي

أمثلة على الخداع الإستراتيجي

التعلم المعزز وتحديات الأمان

إشكالية النوايا المخفية

مخاوف حول مستقبل الأمان

إبراهيم شعبان

اترك ردّاًإلغاء الرد

مقالات مشابهة