واجهت تقنية “DeepSeek-OCR” التي طورتها شركة الذكاء الاصطناعي الصينية الناشئة “ديب سيك” انتقادات من باحثين صينيين ويابانيين، بعد أن تبين أن أدائها على النصوص الطويلة غير متسق ويعتمد بشكل كبير على المعرفة المسبقة بدلًا من الفهم البصري الفعلي.
أزمة “عنق الزجاجة” للنصوص الطويلة
تعاني نماذج الذكاء الاصطناعي من قيد يُعرف بـ”عنق الزجاجة للسياق الطويل”، ما يحد من قدرتها على معالجة المستندات الطويلة والمحادثات الممتدة. وقد ركزت شركات ومعاهد بحثية عالمية على تطوير حلول لهذه المشكلة لتحسين أداء أنظمة الذكاء الاصطناعي.
تفاصيل تقنية DeepSeek-OCR
تم تصميم تقنية DeepSeek-OCR لضغط النصوص باستخدام تمثيلات بصرية، مع وعد بتحسين التعامل مع المستندات الكبيرة والمعقدة وتقليل عدد الرموز بنسبة 7 إلى 20 ضعفًا، حسب ما أعلنت الشركة عند نشر التقنية في أكتوبر الماضي.
نتائج البحث الجديدة
أظهرت التجارب أن دقة DeepSeek-OCR في الإجابة على الأسئلة المرئية تتراجع إلى حوالي 20% عند إضافة نصوص جديدة، مقارنة بدقة تتجاوز 90% للنماذج القياسية، مما يثير تساؤلات حول مدى فعالية الضغط البصري كحل لمشكلة السياق الطويل.
آراء الخبراء
وصف بعض علماء الحاسوب التقنية بأنها “سلاح ذو حدين”، إذ يمكن أن تساعد المعرفة المسبقة للذكاء الاصطناعي في تفسير النصوص الصعبة، لكنها قد تكون عائقًا أمام المواد المطبوعة بوضوح.




