علي بابا تطلق أدوات ذكاء اصطناعي لتوليد واستنساخ الأصوات بـ10 لغات

إطلاق نماذج جديدة من سلسلة Qwen3

أعلنت شركة علي بابا كلاود عن طرح نموذجين جديدين من سلسلة Qwen3 للذكاء الاصطناعي، يركزان على توليد الأصوات واستنساخها عبر أوامر نصية، في خطوة تهدف إلى تعزيز تطبيقات الصوت الاحترافية وصناعة المحتوى الرقمي بشكل أكثر دقة ومرونة.

Qwen3-TTS-VD-Flash: التحكم الكامل في الصوت

النموذج الأول، Qwen3-TTS-VD-Flash، يتيح إنشاء أصوات استنادًا إلى المشاعر، نبرة الصوت، وسرعة الإلقاء، مع إمكانية تحديد العمر، نوع الصوت، والأسلوب. هذه المزايا تمنح المستخدم تحكمًا واسعًا في المخرجات الصوتية. وتؤكد علي بابا أن النموذج يتفوق على واجهة OpenAI الخاصة بـ GPT-4o mini-tts، بحسب تقرير موقع SCMP.

Qwen3-TTS-VC-Flash: استنساخ الأصوات بـ10 لغات

النموذج الثاني، Qwen3-TTS-VC-Flash، يختص باستنساخ الأصوات، حيث يمكنه نسخ صوت شخص من مقطع لا يتجاوز ثلاث ثوانٍ، مع إعادة إنتاجه بعشر لغات مختلفة. ويتميز النموذج بقدرته على التعامل مع نصوص معقدة، تقليد أصوات الحيوانات، واستخراج الأصوات من التسجيلات، مع معدل أخطاء أقل مقارنةً بمنافسين مثل ElevenLabs وMiniMax.

توفر الأدوات وتجربة النسخ التجريبية

توفر النماذج الجديدة عبر واجهة برمجة التطبيقات الخاصة بعلي بابا كلاود، مع إمكانية تجربة النسخ التجريبية على منصة Hugging Face، لتلبية احتياجات الشركات والمطورين في الإعلانات، الألعاب، وصناعة الفيديو.

استخدامات واسعة وتقليل التكلفة

تفتح هذه الأدوات المجال أمام استخدامات متعددة تشمل: إنتاج الإعلانات الصوتية، الدبلجة متعددة اللغات، صناعة الشخصيات الصوتية في الألعاب، دعم التعليم الإلكتروني، وخدمات مراكز الاتصال. كما توفر توفيرًا كبيرًا في الوقت والتكلفة مقارنة بالأساليب التقليدية.

 

شارك هذا الخبر
يوسف إبراهيم
يوسف إبراهيم
المقالات: 949

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *