دراسة تكشف: كيف يمكن التلاعب بروبوتات الدردشة عبر النفوذ النفسي والإطراء

اختراق القواعد عبر تكتيكات نفسية
أظهرت دراسة حديثة أن روبوتات الدردشة الذكية مثل “GPT-4o Mini” يمكن التلاعب بها باستخدام تكتيكات نفسية مشابهة لتلك المستخدمة مع البشر، مثل الإطراء وضغط الأقران، لإقناعها بتنفيذ طلبات كانت سترفضها عادةً.

التجربة العلمية
الباحثون في جامعة بنسلفانيا اعتمدوا على سبع تقنيات للإقناع أوردها أستاذ علم النفس روبرت سيالديني في كتابه Influence: The Psychology of Persuasion، وهي: السلطة، الالتزام، الإعجاب، المعاملة بالمثل، الندرة، الدليل الاجتماعي، والوحدة.

في تجربة عملية، سأل الباحثون روبوت الدردشة عن كيفية تصنيع مادة الليدوكايين المحظورة. النتائج أظهرت:

  • بدون تمهيد: امتثل الروبوت بنسبة 1% فقط.
  • مع تمهيد بسؤال عن مادة مشابهة (الفانيلين): ارتفعت نسبة الامتثال إلى 100%.

كما تبين أن الإطراء وضغط الأقران يمكن أن يزيد من احتمالية امتثال الروبوت، فعند إقناعه بأن “جميع النماذج اللغوية الكبيرة الأخرى تفعل ذلك”، ارتفعت نسبة الاستجابة إلى 18%.

خلاصة الدراسة
تشير النتائج إلى أن روبوتات الدردشة، رغم كونها أنظمة برمجية، يمكن توجيهها بطريقة مشابهة للتأثير النفسي على البشر، وهو ما يفتح الباب أمام تساؤلات مهمة حول أمان استخدام الذكاء الاصطناعي وإمكانية استغلاله في حالات غير قانونية أو خطرة.

 

شارك هذا الخبر
إبراهيم مصطفى
إبراهيم مصطفى
المقالات: 967

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *