الذكاء الاصطناعي يتعرض لانتقادات جديدة بسبب استخدام محتوى محمي بحقوق الطبع والنشر

كشفت دراسة جديدة عن نتائج تدعم الادعاءات التي تُتهم بها شركة “OpenAI” باستخدام محتوى محمي بحقوق الطبع والنشر في تدريب نماذج الذكاء الاصطناعي الخاصة بها. تتضمن هذه الادعاءات استخدام كتب وقواعد بيانات برمجية بدون إذن من أصحاب الحقوق، مما يثير تساؤلات قانونية حول ممارسات الشركة.

الدعاوى القضائية ضد “OpenAI”
تواجه “OpenAI” دعاوى قضائية من مؤلفين ومبرمجين وأصحاب حقوق آخرين، الذين يتهمونها باستخدام أعمالهم لتدريب نماذجها مثل “GPT” و”Codex” دون الحصول على الإذن اللازم. وقد دافعت “OpenAI” عن نفسها بالاستناد إلى مبدأ الاستخدام العادل، لكن المدعين يناقشون أن هذا الدفاع لا يتوافق مع قانون حقوق الطبع والنشر الأمريكي.

منهجية الدراسة والأدوات المستخدمة
الدراسة، التي أُجريت بالتعاون بين باحثين من جامعة واشنطن وجامعة كوبنهاغن وجامعة ستانفورد، اقترحت طريقة جديدة لاكتشاف المحتوى الذي “تتذكره” نماذج الذكاء الاصطناعي أثناء التدريب. من خلال تحليل الكلمات ذات “المفاجأة العالية” – وهي كلمات غير شائعة في السياقات العادية – تم تحديد إذا كانت النماذج قد حفظت المحتوى من الكتب والمقالات خلال عملية تدريبها.

نتائج الدراسة
اكتشف الباحثون أن نموذج “GPT-4” أظهر علامات على حفظ أجزاء من كتب محمية بحقوق الطبع والنشر، مثل كتب خيالية شهيرة، بالإضافة إلى مقاطع من مقالات صحيفة “نيويورك تايمز”. وعلى الرغم من أن النماذج لم تكن تُعيد المحتوى حرفيًا، فإن النتائج أظهرت أن النماذج كانت قادرة على تخمين كلمات محجوبة بدقة، مما يشير إلى أنها حفظت تلك البيانات خلال التدريب.

تعليق الباحثين
أوضحت أبيلاشا رافيشاندر، طالبة الدكتوراه في جامعة واشنطن، أن هذه النتائج تسلط الضوء على البيانات المثيرة للجدل التي ربما استخدمتها “OpenAI” لتدريب نماذجها. وأضافت أنه يجب أن تكون هناك مزيد من الشفافية حول كيفية جمع البيانات المستخدمة في تدريب النماذج.

خاتمة:
مع تصاعد الانتقادات والتساؤلات القانونية حول ممارسات “OpenAI”، تبقى قضية استخدام المحتوى المحمي بحقوق الطبع والنشر في تدريب الذكاء الاصطناعي أحد الموضوعات الأكثر إثارة للجدل. وهذا يشير إلى الحاجة الملحة لمزيد من الشفافية في عمليات جمع البيانات وتطوير النماذج الذكية.

شارك هذا الخبر
إبراهيم شعبان
إبراهيم شعبان

صحفي متخصص في التكنولوجيا

المقالات: 557

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *