منذ إطلاق “شات جي بي تي” في أواخر 2022، ارتفعت المخاوف من استيلاء الذكاء الاصطناعي على وظائف البشر، لكن تلك المخاوف لم توقف سباق الشركات نحو تطوير هذه النماذج. ومع استمرار النجاحات الظاهرة لنماذج الذكاء الاصطناعي، ظهرت تساؤلات جديدة حول مصداقية هذه النتائج.
هنا بدأت شركة جديدة تُدعى “فالس إيه آي” (Vals AI) مهمتها: اختبار نماذج الذكاء الاصطناعي بعيدًا عن الشركات المطورة لها، عبر اختبارات دقيقة تركز على الواقع المهني، خصوصًا في المجال المالي.
نتائج متدنية في اختبارات بسيطة
أجرت “فالس إيه آي” اختبارات على 22 نموذجًا من شركات مثل “أوبن إيه آي”، “غوغل”، “آنثروبيك”، و”ميتا”، ليتبيّن أن جميع النماذج سجلت أقل من 50% في اختبارات مالية غير معقدة.
الاختبارات تضمنت مهام يستخدمها المحللون الماليون والصحفيون المتخصصون بشكل يومي، مثل البحث داخل قاعدة بيانات “إدغار” (EDGAR) التابعة لهيئة الأوراق المالية الأمريكية.
أحدث نماذج “أوبن إيه آي” (O3) لم يتمكن من تجاوز نسبة 48.3%، بينما حقق نموذج “كلود سونيت 3.7” من “آنثروبيك” 44.1%. أما نماذج “ميتا” فلم تتجاوز 10% في جميع الاختبارات.
ثغرة بين التدريب والواقع
ريان كريشنان، مؤسس “فالس إيه آي”، يرى أن السبب الرئيسي وراء هذه النتائج السيئة يعود إلى أن النماذج تُدرّب غالبًا على أوراق علمية وأبحاث أكاديمية لا تمسّ الواقع العملي.
كما أن أغلب الاختبارات السابقة تعتمد على بيانات عامة متاحة للنماذج مسبقًا، مما يجعل نتائجها مضللة. أما “فالس إيه آي”، فقد اعتمدت على خبراء ماليين لبناء اختبار مكون من 500 سؤال يغطي مهامًا حقيقية واحترافية في أسواق المال.
هل يفشل الذكاء الاصطناعي في المهام الحقيقية؟
كشفت نتائج الاختبارات عن فجوة كبيرة بين إمكانات النماذج في التعامل مع أوراق بحثية وبين قدرتها على التعامل مع تحديات الحياة العملية، خصوصًا في القطاع المالي الذي يتطلب دقة وسرعة.
كريشنان يؤكد أن الحل هو وجود اختبارات مستقلة مثل التي تقوم بها “فالس إيه آي”، لتقييم فعلي للمخرجات وتحديد مواطن الضعف الحقيقية في النماذج.
شركات التكنولوجيا تتجاهل النتائج
رغم أهمية نتائج “فالس إيه آي”، فإن الشركات الكبرى مثل “أوبن إيه آي” و”غوغل” و”ميتا” لم تعلّق على التقرير ولم تُظهر أي تجاوب علني مع نتائج الاختبارات.
الذكاء الاصطناعي.. بديل أم أداة مساعدة؟
بينما يرى البعض، مثل بيل غيتس، أن الذكاء الاصطناعي سيحلّ محل الأطباء والمعلمين، تؤكد اختبارات “فالس إيه آي” أن هذه التقنيات لا تزال بعيدة عن أداء المهام البشرية الدقيقة في مجالات معينة، خصوصًا عندما تفتقر إلى التدريب الميداني أو السياق الواقعي.
ختامًا، يبدو أن الذكاء الاصطناعي لن يستبدل الإنسان في المستقبل القريب، بل سيكون أداة تعتمد كفاءتها على الطريقة التي يتم تدريبها بها، وعلى قدرتها في التعامل مع الواقع، وليس فقط الورق.
هل ترغب في نسخة مختصرة من هذا الخبر للمنصات الاجتماعية أو عنوان أكثر جذبًا لجمهور معين؟




