أكدت دراسة حديثة أن روبوتات الدردشة المعتمدة على الذكاء الاصطناعي لا يمكن الوثوق بها للحصول على معلومات دقيقة، حيث تبين أنها غالبًا ما تقدم إجابات خاطئة بثقة مفرطة، مما يعزز المخاوف بشأن الاعتماد عليها كمصدر للحقائق.
أداء ضعيف في البحث عن المصادر
أجرت مجلة Columbia Journalism Review دراسة شملت ثمانية روبوتات دردشة تدّعي قدرتها على البحث عبر الإنترنت، وهي:
- ChatGPT
- DeepSeek
- Groq 2
- Groq 3
- Gemini
- Copilot
- Perplexity
- Perplexity Pro
وقد تم اختبار هذه النماذج عبر إعطائها اقتباسات من مقالات صحفية وطلب العثور على المقالات الأصلية، بما في ذلك رابط المصدر، والعنوان، واسم الناشر، وتاريخ النشر.
النتائج: أخطاء متكررة وثقة زائدة
تم تصنيف إجابات الروبوتات إلى عدة فئات، منها:
- إجابات صحيحة تمامًا
- إجابات صحيحة ولكنها غير مكتملة
- إجابات غير صحيحة جزئيًا أو كليًا
- عدم القدرة على الإجابة
وكانت النتائج صادمة:
- في المتوسط، كانت روبوتات الدردشة دقيقة بنسبة أقل من 40% فقط
- كان Perplexity الأكثر دقة بنسبة 63%، لكنه اعتمد على طرق مشكوك فيها للوصول إلى المعلومات المحمية بجدار الدفع
- كان Groq 3 الأسوأ بنسبة 6% فقط
- ChatGPT جاء في مرتبة متوسطة، حيث قدم نتائج أقل سوءًا مقارنة بغيره
لماذا لا يمكن الوثوق بروبوتات الدردشة؟ وفق ما نشرته العربية
- نادراً ما ترفض الإجابة عند عدم توفر المعلومات، بل تقدم إجابات تخمينية غير دقيقة
- تعتمد على مصادر غير موثوقة أو غير مصرح بها
- تقدم المعلومات بثقة زائدة دون تحذيرات كافية عند عدم اليقين
الخلاصة: استخدمها للإلهام وليس للحقائق
أوصت الدراسة بعدم الاعتماد على روبوتات الدردشة كمصدر موثوق للحقائق، بل يمكن استخدامها كمصدر إلهام وأداة لمساعدة المستخدمين في البحث والتفكير، دون الاعتماد عليها للحصول على معلومات دقيقة أو موثوقة.