إطلاق نماذج جديدة من سلسلة Qwen3
أعلنت شركة علي بابا كلاود عن طرح نموذجين جديدين من سلسلة Qwen3 للذكاء الاصطناعي، يركزان على توليد الأصوات واستنساخها عبر أوامر نصية، في خطوة تهدف إلى تعزيز تطبيقات الصوت الاحترافية وصناعة المحتوى الرقمي بشكل أكثر دقة ومرونة.
Qwen3-TTS-VD-Flash: التحكم الكامل في الصوت
النموذج الأول، Qwen3-TTS-VD-Flash، يتيح إنشاء أصوات استنادًا إلى المشاعر، نبرة الصوت، وسرعة الإلقاء، مع إمكانية تحديد العمر، نوع الصوت، والأسلوب. هذه المزايا تمنح المستخدم تحكمًا واسعًا في المخرجات الصوتية. وتؤكد علي بابا أن النموذج يتفوق على واجهة OpenAI الخاصة بـ GPT-4o mini-tts، بحسب تقرير موقع SCMP.
Qwen3-TTS-VC-Flash: استنساخ الأصوات بـ10 لغات
النموذج الثاني، Qwen3-TTS-VC-Flash، يختص باستنساخ الأصوات، حيث يمكنه نسخ صوت شخص من مقطع لا يتجاوز ثلاث ثوانٍ، مع إعادة إنتاجه بعشر لغات مختلفة. ويتميز النموذج بقدرته على التعامل مع نصوص معقدة، تقليد أصوات الحيوانات، واستخراج الأصوات من التسجيلات، مع معدل أخطاء أقل مقارنةً بمنافسين مثل ElevenLabs وMiniMax.
توفر الأدوات وتجربة النسخ التجريبية
توفر النماذج الجديدة عبر واجهة برمجة التطبيقات الخاصة بعلي بابا كلاود، مع إمكانية تجربة النسخ التجريبية على منصة Hugging Face، لتلبية احتياجات الشركات والمطورين في الإعلانات، الألعاب، وصناعة الفيديو.
استخدامات واسعة وتقليل التكلفة
تفتح هذه الأدوات المجال أمام استخدامات متعددة تشمل: إنتاج الإعلانات الصوتية، الدبلجة متعددة اللغات، صناعة الشخصيات الصوتية في الألعاب، دعم التعليم الإلكتروني، وخدمات مراكز الاتصال. كما توفر توفيرًا كبيرًا في الوقت والتكلفة مقارنة بالأساليب التقليدية.




