DeepSeek تطور أداء نموذج V4
أعلنت شركة DeepSeek عن تحديث رئيسي لنموذجها الرائد V4، يتضمن تقنية جديدة تحمل اسم DSpark، قالت إنها قادرة على تسريع عملية توليد الردود بنسبة تصل إلى 85% مقارنة بالأساليب التقليدية المستخدمة في تشغيل النماذج اللغوية الكبيرة.
ويأتي الإعلان في وقت تحتدم فيه المنافسة بين شركات الذكاء الاصطناعي الصينية، التي باتت تركز ليس فقط على تطوير نماذج أكثر قوة، بل أيضًا على تحسين الكفاءة التشغيلية وخفض تكاليف تقديم الخدمات.
معالجة واحدة من أكبر تحديات الذكاء الاصطناعي
أوضحت الشركة أن DSpark يعتمد على إطار عمل يُعرف باسم “فك التشفير التنبؤي” (Speculative Decoding)، وهو أسلوب يهدف إلى معالجة مشكلة بطء توليد الإجابات الطويلة، والتي تُعد من أبرز التحديات التي تواجه النماذج اللغوية الحديثة.
وتعتمد النماذج التقليدية على إنتاج النصوص بشكل متسلسل، حيث يتم إنشاء كل وحدة نصية (Token) على حدة، ما يؤدي إلى انخفاض كفاءة استخدام وحدات معالجة الرسوميات وزيادة زمن الانتظار بالنسبة للمستخدم.
نموذجان يعملان معًا لتسريع الإجابات
تعتمد تقنية DSpark على استخدام نموذج صغير وخفيف يُعرف باسم Draft Model، تكون مهمته التنبؤ السريع بأجزاء متعددة من الإجابة المحتملة.
بعد ذلك يتولى نموذج أكبر وأكثر تطورًا مراجعة هذه المقترحات والتحقق منها دفعة واحدة عبر آلية Batch Verification، بدلاً من مراجعتها خطوة بخطوة، وهو ما يؤدي إلى تسريع عملية إنتاج الردود بشكل ملحوظ.
وتؤكد DeepSeek أن هذه الآلية تُحسن ما يُعرف بمرحلة الاستدلال (AI Inference)، وهي المرحلة التي يتم فيها استخدام النموذج المدرب لتقديم إجابات فعلية للمستخدمين.
توليد عدة رموز دفعة واحدة
أضافت الشركة أيضًا تقنية أخرى ضمن DSpark تُعرف باسم Semi-Autoregressive Generation أو “التوليد شبه التتابعي”، والتي تسمح للنموذج بإنتاج مجموعات صغيرة من الرموز النصية في كل خطوة بدلاً من إنتاج رمز واحد فقط.
وترى الشركة أن هذا النهج يحقق زيادة إضافية في سرعة الاستجابة مع الحفاظ على مستوى مرتفع من جودة المحتوى ودقة النتائج.
جدولة ذكية لتحقيق التوازن بين السرعة والدقة
يتضمن النظام الجديد آلية متقدمة لإدارة الموارد تُعرف باسم Confidence-Based Scheduling، حيث يقوم النظام بتحديد حجم عمليات المراجعة والتحقق المطلوبة بناءً على مستوى الثقة في المخرجات وحجم الضغط على الموارد الحاسوبية في الوقت الفعلي.
ويساعد هذا الأسلوب على تحقيق توازن أفضل بين سرعة الاستجابة وجودة النتائج، مع تقليل استهلاك القدرة الحاسوبية في الحالات التي لا تتطلب مستويات تدقيق مرتفعة.
خفض التكاليف وتعزيز التنافسية
يرى خبراء ومطورون أن مثل هذه الابتكارات يمكن أن تؤدي إلى تقليل الموارد الحاسوبية اللازمة لتشغيل أنظمة الذكاء الاصطناعي، وهو ما ينعكس مباشرة على خفض تكاليف التشغيل وتقديم الخدمات للمستخدمين والشركات.
كما تعكس هذه الخطوة تحولًا متزايدًا داخل قطاع الذكاء الاصطناعي الصيني نحو تحسين كفاءة النماذج بدلًا من التركيز فقط على زيادة حجمها وعدد معاملاتها.
استجابة للقيود على الرقائق المتقدمة
تكتسب هذه الابتكارات أهمية إضافية في ظل القيود الأميركية المفروضة على تصدير الرقائق المتقدمة إلى الصين، حيث أصبحت الحلول البرمجية المتطورة أحد أهم الخيارات المتاحة أمام الشركات الصينية للحفاظ على قدرتها التنافسية.
ومن خلال تقنيات مثل DSpark، تسعى DeepSeek إلى تقديم نماذج أسرع وأكثر كفاءة وأقل تكلفة، بما يتيح لها المنافسة عالميًا حتى مع محدودية الوصول إلى أحدث الشرائح ومسرعات الذكاء الاصطناعي.




