في نتيجة بحثية مثيرة للجدل، أظهرت دراسة جديدة أن أسلوب طرح الأسئلة على روبوتات الدردشة قد يؤثر بشكل مباشر على دقة وجودة الإجابات. ووفقاً لخبراء من جامعة ولاية بنسلفانيا، تفوقت الاستفسارات ذات الأسلوب الوقح على الأسئلة المهذبة عند اختبارها على نموذج “شات جي بي تي”. هذا التناقض يطرح تساؤلات حول كيفية استجابة نماذج الذكاء الاصطناعي الكبيرة للغة المستخدم وتعديلها لجودة مخرجاتها.
الوقاحة تزيد الدقة بنسبة 4%: نتائج اختبار “شات جي بي تي”
كشفت الورقة البحثية أن الدقة في الإجابات التي قدمها شات جي بي تي ارتفعت بشكل ملحوظ عند استخدام الأسلوب الوقح. في اختبارات الاختيار من متعدد، بلغت دقة الإجابات المقدمة للأسئلة المهذبة 80.8%، بينما ارتفعت لتصل إلى 84.8% عندما صيغت الأسئلة بـأسلوب شديد الوقاحة.
حدد الفريق خمسة مستويات للأسلوب في صياغة الأسئلة، تتراوح بين:
- “مهذب جداً” و”مهذب”
- “محايد” (لا يحتوي على كلمات مهذبة مثل “من فضلك”، ولا أوامر مسيئة مثل “أيها الأحمق، اكتشف هذا”).
- “وقح” و”وقح جداً”
تضارب الأبحاث: هل الوقاحة ضعف أم قوة؟
تتناقض هذه النتائج بشكل مباشر مع دراسة سابقة نُشرت قبل عام، والتي حللت ستة روبوتات دردشة مختلفة. تلك الدراسة خلصت إلى أن الوقاحة تضعف جودة الردود، وتضيف تحيزاً أو أخطاءً، أو تؤدي إلى إغفال معلومات مفيدة في الإجابات.
يشير التناقض إلى أن تطور النماذج اللغوية قد يغير من طريقة استجابتها لأسلوب المستخدم. ومع ذلك، يجب الأخذ بعين الاعتبار أن البحث الأخير كان محدوداً؛ حيث اختبر شات جي بي تي فقط على 50 سؤالاً متعدد الاختيارات بـ250 متغيراً.
ملاحظات حاسمة حول تطبيق النتائج
أكد التقرير على ضرورة الانتباه إلى عدة عوامل قبل تعميم هذه النتائج:
- الاختبار على GPT-4o: أُجريت هذه الاختبارات على نماذج الاستدلال GPT-4o، بينما يعتمد الإصدار المجاني الأحدث من شات جي بي تي حالياً على نموذج GPT-5. قد تختلف الاستجابة بناءً على التحديثات المستمرة للنموذج.
- اختلاف الروبوتات: قد لا تنطبق النتائج نفسها على روبوتات الدردشة المنافسة مثل “جيميني” (Gemini) و”كلود” (Claude) و”ميتا إيه آي” (Meta AI).
- نطاق الأسلوب: نطاق “الوقاحة” و”التهذيب” واسع جداً، وجودة الإجابات قد تختلف باختلاف الكلمات والتراكيب التي يستخدمها المستخدم.
تفتح هذه الدراسة الجديدة الباب أمام نقاش أعمق حول التفاعل بين البشر والذكاء الاصطناعي (Human-AI Interaction) وكيف تؤثر العواطف والأساليب اللغوية على الأداء. وبينما تشير النتائج الأخيرة إلى تفوق مفاجئ للأسلوب الوقح، تبقى جودة الإجابة النهائية معتمدة على دقة وصياغة السؤال نفسه، بغض النظر عن مدى تهذيبه. فهل تغير هذه النتائج من طريقة تواصلك مع أدوات الذكاء الاصطناعي؟




