مخاوف من نقص البيانات الحقيقية
اتفق إيلون ماسك مع آراء العديد من خبراء الذكاء الاصطناعي على أن هناك قلة متبقية من البيانات الحقيقية لتدريب نماذج الذكاء الاصطناعي. وأشار ماسك خلال محادثة مباشرة مع رئيس شركة ستاجويل مارك بين على منصة “X” إلى أن “المجموع التراكمي للمعرفة البشرية قد استنفد بشكل أساسي في تدريب الذكاء الاصطناعي”، مؤكداً أن هذه القلة من البيانات تشكل تحديًا كبيرًا في تحسين نماذج الذكاء الاصطناعي.
البيانات الاصطناعية: الحل المحتمل
رغم نقص البيانات الحقيقية، يعتقد ماسك أن الحل الأمثل يكمن في استخدام البيانات الاصطناعية (التي يولدها الذكاء الاصطناعي نفسه) لاستكمال التدريب. وقال: “الطريقة الوحيدة لاستكمال بيانات العالم الحقيقي هي البيانات الاصطناعية، حيث يقوم الذكاء الاصطناعي بإنشاء بيانات التدريب.” هذا النهج يمكن أن يساهم في تحسين نماذج الذكاء الاصطناعي بشكل فعال.
استخدام البيانات الاصطناعية في الشركات الكبرى
تستخدم شركات كبرى مثل “مايكروسوفت”، “ميتا”، “أوبن إيه آي”، و”أنثروبيك” بالفعل البيانات الاصطناعية في تدريب نماذجها الرائدة. على سبيل المثال، قامت “مايكروسوفت” بتدريب نموذج “Phi-4” باستخدام بيانات اصطناعية بجانب البيانات الحقيقية، وهو ما يعكس تزايد الاعتماد على هذه التقنية في صناعة الذكاء الاصطناعي.
كما أن جارتنر توقعت أن 60% من البيانات المستخدمة في مشاريع الذكاء الاصطناعي في عام 2024 ستكون من البيانات الاصطناعية.
التوفير في النفقات باستخدام البيانات الاصطناعية
من فوائد استخدام البيانات الاصطناعية في تدريب النماذج هو توفير التكاليف. على سبيل المثال، تدعي شركة “Writer” الناشئة أن نموذجها “Palmyra X 004″، الذي تم تطويره باستخدام مصادر اصطناعية بالكامل تقريبًا، تكلف تطويره 700 ألف دولار فقط، وهو مبلغ أقل بكثير مقارنةً بتقديرات تطوير نماذج مماثلة مثل نموذج “OpenAI” الذي قد يتطلب 4.6 مليون دولار.
مخاطر الاعتماد على البيانات الاصطناعية
رغم هذه الفوائد، هناك تحذيرات من أن الاعتماد على البيانات الاصطناعية قد يؤدي إلى بعض العيوب. تشير بعض الأبحاث إلى أن النماذج المدربة على بيانات اصطناعية قد تصبح أقل “إبداعًا” وأكثر تحيزًا في مخرجاتها. هذا قد يعرض فاعلية هذه النماذج للخطر، خصوصًا إذا كانت البيانات الاصطناعية نفسها تحتوي على تحيزات أو قيود.
التحديات المستقبلية في تدريب الذكاء الاصطناعي
في المستقبل، قد يتطلب تطوير نماذج ذكاء اصطناعي أكثر دقة وفاعلية توازناً بين البيانات الحقيقية والاصطناعية. تحتاج الصناعة إلى إيجاد حلول لتقليل التحيزات في البيانات الاصطناعية وضمان تنوعها لتجنب التأثيرات السلبية على أداء النماذج.