اتهام بحذف بيانات حاسمة في قضية حقوق الطبع والنشر
قال محامو صحيفتي “نيويورك تايمز” و”ديلي نيوز”، اللذان يقاضيان شركة OpenAI بتهمة استخدام محتواهما لتدريب نماذج الذكاء الاصطناعي دون إذن، إن مهندسي OpenAI حذفوا عن غير قصد بيانات قد تكون حاسمة في القضية. وكان المحامون قد حصلوا على إذن من OpenAI للوصول إلى بيانات تدريب الذكاء الاصطناعي الخاصة بها لإجراء عمليات بحث عن المحتوى المحمي بحقوق الطبع والنشر.
البحث في بيانات OpenAI لاستخراج المحتوى المحمي بحقوق الطبع والنشر
منذ بداية نوفمبر، قضى محامو الصحيفتين وخبراؤهم أكثر من 150 ساعة في البحث في بيانات تدريب OpenAI. وكان الهدف هو تحديد ما إذا كانت الشركة قد استخدمت مقاطع محمية بحقوق الطبع والنشر في بناء نماذج الذكاء الاصطناعي الخاصة بها. ومع ذلك، في 14 نوفمبر، حدث خطأ تقني من قبل مهندسي OpenAI أسفر عن مسح جميع بيانات البحث المخزنة على أحد الخوادم الافتراضية، مما أثار استياء المدعين.
محاولة استرجاع البيانات المحذوفة
على الرغم من محاولات OpenAI لاستعادة البيانات، نجحت الشركة في استرجاع جزء كبير منها. لكن بسبب فقدان أسماء الملفات بشكل دائم، أصبح من المستحيل تحديد مكان استخدام المقالات المنسوخة في تدريب النماذج. ووفقًا للمحامين، فإن فقدان هذه البيانات يعيق القضية ويجبر المدعين على إعادة بناء العمل الذي تم إنجازه.
إعادة البناء من الصفر بسبب فقدان البيانات
أشار محامو الصحيفتين إلى أن المدعين قد اضطُروا لإعادة إنشاء العمل من الصفر باستخدام ساعات عمل كبيرة ووقت معالجة الكمبيوتر. وذكر المحامون أنهم علموا فقط في وقت لاحق بأن البيانات المستردة غير قابلة للاستخدام، مما يعني أن أسبوعًا كاملاً من العمل يجب أن يُعاد إنجازه.
إعلان عن صفقات ترخيص مع ناشرين آخرين
في وقت لاحق، أكدت OpenAI أنها وقعت صفقات ترخيص مع عدد متزايد من الناشرين الجدد، لكنها رفضت الكشف عن شروط هذه الصفقات. وردت تقارير إعلامية تشير إلى أن أحد شركاء المحتوى، “Dotdash”، يحصل على ما لا يقل عن 16 مليون دولار سنويًا من OpenAI.
التأكيد على عدم وجود نية متعمدة
وأكد محامو المدعين أنهم لا يعتقدون أن الحذف كان متعمدًا. ومع ذلك، فإن هذه الواقعة تثير أسئلة حول إدارة البيانات داخل الشركات التي تعمل في مجال الذكاء الاصطناعي وتؤثر بشكل كبير على سير القضايا القانونية المتعلقة بحقوق الطبع والنشر.