أعاد التسارع الكبير في تطور تقنيات الذكاء الاصطناعي إحياء الجدل حول الأتمتة ومستقبل الوظائف، وسط توقعات متباينة بين التفاؤل المفرط والتشاؤم الحاد. فبينما تُظهر الأنظمة الحديثة أداءً متقدماً في الاختبارات التقنية والبحثية، يبقى السؤال الجوهري مطروحاً: هل يستطيع الذكاء الاصطناعي إنجاز أعمال حقيقية ذات قيمة اقتصادية كما يتطلبها سوق العمل؟
للإجابة عن هذا التساؤل، قدمت دراسة حديثة إطاراً قياسياً جديداً أطلقت عليه اسم «مؤشر العمل عن بُعد» (Remote Labor Index – RLI)، وهو أول معيار تجريبي يقيس بشكل منهجي قدرة وكلاء الذكاء الاصطناعي على تنفيذ مشاريع عمل متكاملة مأخوذة من أسواق العمل الحر الفعلية، لا من مهام اصطناعية مبسطة.
تجاوز الاختبارات التقليدية
على عكس المقاييس الشائعة التي تركز على مهام معزولة مثل كتابة شيفرات قصيرة أو الإجابة عن أسئلة تقنية، يسعى المؤشر الجديد إلى محاكاة التعقيد الحقيقي للعمل المهني، حيث تتداخل المهارات، وتتعدد المتطلبات، ويكون الحكم النهائي مرتبطاً بقبول العميل وجودة التسليم.
ويشمل المؤشر مشاريع في مجالات متنوعة مثل التصميم، والهندسة المعمارية، وإنتاج الفيديو، وتحليل البيانات، وتطوير الألعاب، وإعداد الوثائق، وهي قطاعات تمثل جوهر الاقتصاد الرقمي والعمل عن بُعد اليوم.
كيف تم قياس المؤشر؟
اعتمدت الدراسة على قاعدة بيانات تضم 240 مشروع عمل حر مكتمل، يحتوي كل مشروع على وصف تفصيلي، وملفات إدخال، ومخرجات نهائية أنجزها محترفون بشريون لتكون مرجعاً للمقارنة.
وبلغ متوسط زمن تنفيذ المشروع الواحد نحو 29 ساعة عمل بشري، فيما تجاوزت بعض المشاريع 100 ساعة، مع تكاليف تراوحت بين أقل من 10 دولارات وأكثر من 10 آلاف دولار، بإجمالي قيمة تجاوزت 140 ألف دولار وأكثر من 6 آلاف ساعة عمل.
نتائج أقل من التوقعات
بعد اختبار عدة نماذج متقدمة من وكلاء الذكاء الاصطناعي، أظهرت النتائج أن أعلى معدل أتمتة تم تحقيقه لم يتجاوز 2.5% فقط، أي أن أقل من ثلاثة مشاريع من كل مائة وصلت إلى مستوى مهني مقبول مقارنة بالعمل البشري.
وتشير هذه النتيجة إلى فجوة واضحة بين التفوق في المعايير التقنية وبين القدرة على تنفيذ مشاريع متكاملة بجودة سوقية حقيقية.
أين ينجح الذكاء الاصطناعي وأين يتعثر؟
كشفت الدراسة أن أسباب الفشل غالباً ما تعود إلى أخطاء تقنية أساسية، مثل مخرجات ناقصة أو ملفات غير صالحة أو عدم الالتزام بالصيغ المطلوبة، إضافة إلى ضعف التكامل والجودة النهائية.
في المقابل، سجل الذكاء الاصطناعي أداءً أفضل نسبياً في مهام محددة، خاصة تلك المعتمدة على النصوص والصور والصوت، مثل كتابة التقارير، والتصميم البصري البسيط، وبعض أعمال التحرير الصوتي وتصور البيانات البرمجية.
دعم الإنتاجية لا استبدال الوظائف
رغم محدودية الأتمتة الكاملة، أظهرت تصنيفات الأداء النسبية تحسناً واضحاً بين النماذج الأحدث والأقدم، ما يؤكد أن التقدم حقيقي لكنه تدريجي.
وتخلص الدراسة إلى أن التأثير القريب للذكاء الاصطناعي سيكون في تعزيز إنتاجية البشر على مستوى المهام، لا في إلغاء الوظائف بالكامل، مع بقاء الحكم البشري وضبط الجودة عناصر أساسية في العمل المهني.
إطار واقعي للنقاش
لا تسعى الدراسة إلى التنبؤ بالمستقبل، بل تقدم خط أساس علمياً وعملياً لفهم موقع الذكاء الاصطناعي اليوم. ومن خلال ربط التقييم بعمل حقيقي وتكلفة فعلية ومعايير مهنية واقعية، توفر أداة أكثر دقة للفصل بين التقدم الفعلي والضجيج الإعلامي في نقاشات الأتمتة ومستقبل العمل.




