أظهرت الدراسات العلمية الحديثة أن النماذج التي تعتمد على الذكاء الاصطناعي التوليدي، مثل “تشات جي بي تي”، تعاني من مشكلة تُعرف بظاهرة “الالتهام الذاتي”. عندما يتم تدريب هذه النماذج باستخدام بيانات تُنتجها التقنية ذاتها، تبدأ النتائج في التدهور وتصبح متضاربة وغير منطقية. هذا يؤدي إلى إنتاج محتوى غير مفيد حتى يتدهور بشكل كامل، كما أشارت دراسة نُشرت في مجلة “نيتشر” في يوليو 2024 ووفق تقرير نشره. دويتشه فيله
البيانات الاصطناعية: منافع ومخاطر
تُستخدم البيانات الاصطناعية – التي تُنتج بواسطة الذكاء الاصطناعي – بشكل متزايد بسبب تكلفتها المنخفضة وسهولة الحصول عليها مقارنة بالبيانات البشرية. ولكن، كلما زادت كمية البيانات الاصطناعية المستخدمة، يقل غنى المعلومات وجودتها. هذا مشابه لطباعة نسخة جديدة من صورة بعد مسح ضوئي، حيث تتدهور الجودة مع كل عملية نسخ.
ظاهرة شبيهة بـ “جنون البقر
باحثون من جامعتي “رايس” و”ستانفورد” وجدوا أن النماذج التي تولد الصور مثل “ميدجورني” و”دال-اي” و”ستيبل ديفيوجن” تصبح مشوشة وغير دقيقة عند استخدام بيانات مُنتَجة بواسطة الذكاء الاصطناعي. هذه الظاهرة تشبه مرض “جنون البقر”، الذي نشأ من استخدام علف حيواني ملوث، مما أدى إلى تدهور الحالة الصحية للمواشي.
التحديات الحالية في جودة البيانات
كما يشير جاثان سادوفسكي من جامعة موناش في أستراليا، فإن البيانات البشرية عالية الجودة أصبحت نادرة. هذا النقص في البيانات البشرية القابلة للقراءة آلياً يؤثر على جودة النماذج ويزيد من الاعتماد على البيانات الاصطناعية. ريتشارد بارانيوك، أحد معدي المقالة في “نيتشر”، حذر من أن الاستمرار في هذا الاتجاه قد يؤدي إلى كارثة تتمثل في تدهور جودة البيانات على الإنترنت.
مستقبل الذكاء الاصطناعي: هل هو في خطر؟
كما كانت أزمة “جنون البقر” لها تأثير كبير على صناعة اللحوم في التسعينيات، فقد تؤثر البيانات الاصطناعية بشكل كبير على جودة المحتوى الذي يتم إنتاجه بواسطة الذكاء الاصطناعي. يتساءل الباحثون والشركات في المجال عن مدى تجاوز استخدام البيانات الاصطناعية الحد المقبول وكيفية تجنب هذه المشكلة.
وجهات نظر مختلفة حول البيانات الاصطناعية
بعض الشركات مثل “أنثروبك” و”هاغينغ فايس” تؤكد أن استخدام البيانات الاصطناعية لا يزال فعالاً. أنتون لوزكوف من “هاغينغ فايس” يعتبر أن المخاوف حول “الجنون” قد تكون مبالغاً فيها. يضيف لوزكوف أن الشركات تقوم بجهود كبيرة لتنظيف البيانات المجمعة، حيث يتم حذف جزء كبير منها للحفاظ على الجودة.
نظرة مستقبلية
على الرغم من المخاوف التي أثيرت حول تأثير البيانات الاصطناعية، فإن بعض المتخصصين يرون أن هذه المشكلة قد تكون مبنية على تخوفات مبالغ فيها. تبقى الحاجة إلى تحسين إدارة البيانات وتطوير أساليب تدريب النماذج لضمان جودة المعلومات وفعالية الذكاء الاصطناعي في المستقبل.