دراسة: نماذج الذكاء الاصطناعي تُظهر علامات ضعف إدراكي مشابهة للبشر

أشارت دراسة حديثة نُشرت في دورية الجمعية الطبية البريطانية “BMJ” إلى أن النماذج اللغوية الكبيرة، مثل ChatGPT، قد تُظهر علامات ضعف إدراكي مشابه للعلامات المبكرة لخرف الشيخوخة عند إخضاعها لاختبارات تقييم الإدراك المستخدمة مع البشر.

تفاوت أداء النماذج اللغوية

ووجدت الدراسة أن الإصدارات الأقدم من هذه النماذج أظهرت أداءً أضعف، مما أثار تساؤلات حول مدى قدرتها على محاكاة الذكاء البشري بشكل فعّال. وبينما حققت النماذج الأحدث مثل GPT4o أداءً أفضل، أظهرت نماذج أخرى مثل Gemini ضعفاً واضحاً في بعض الاختبارات.

اختبارات تقييم الإدراك

طبق الباحثون مجموعة من الاختبارات لتقييم القدرات الإدراكية للنماذج، تضمنت:

  • اختبار التركيز: أظهرت النماذج تفاوتاً في القدرة على التمييز بين التفاصيل.
  • اختبار ستروب: قيّم سرعة استجابة النماذج عند مواجهة معلومات متضاربة.
  • اختبار الرسم البصري: فشلت معظم النماذج في أداء مهام مثل رسم الساعة ونسخ المكعب، وهي أخطاء مشابهة لما يظهر لدى مرضى الخرف.

وأظهرت النماذج أداءً مقبولاً في اختبارات اللغة والانتباه، لكن الأداء انخفض بشكل ملحوظ في المهام التي تتطلب التجريد البصري والوظائف التنفيذية.

مخاطر الاعتماد الكامل على الذكاء الاصطناعي

أثارت الدراسة مخاوف بشأن الاعتماد المتزايد على الذكاء الاصطناعي في اتخاذ القرارات الحساسة، خاصة في المجالات الطبية. وأكد الباحثون أن النماذج اللغوية بحاجة إلى تقييم شامل لنقاط ضعفها قبل الاعتماد الكامل عليها، مع أهمية الإشراف البشري لضمان دقة القرارات.

تحديات جديدة في الطب الافتراضي

اختتمت الدراسة بالإشارة إلى أن الذكاء الاصطناعي قد يفرض تحديات جديدة تتطلب معالجة “مرضى افتراضيين” يتمثلون في نماذج تعاني من ضعف إدراكي. ورغم التقدم الكبير في مجال الذكاء الاصطناعي، فإن استبداله الكامل للعنصر البشري في المستقبل القريب يبدو غير مرجح.

 

 

شارك هذا الخبر
يوسف إبراهيم
يوسف إبراهيم
المقالات: 192

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *