علي بابا تطلق أدوات ذكاء اصطناعي لتوليد واستنساخ الأصوات بـ10 لغات

إطلاق نماذج جديدة من سلسلة Qwen3

أعلنت شركة علي بابا كلاود عن طرح نموذجين جديدين من سلسلة Qwen3 للذكاء الاصطناعي، يركزان على توليد الأصوات واستنساخها عبر أوامر نصية، في خطوة تهدف إلى تعزيز تطبيقات الصوت الاحترافية وصناعة المحتوى الرقمي بشكل أكثر دقة ومرونة.

Qwen3-TTS-VD-Flash: التحكم الكامل في الصوت

النموذج الأول، Qwen3-TTS-VD-Flash، يتيح إنشاء أصوات استنادًا إلى المشاعر، نبرة الصوت، وسرعة الإلقاء، مع إمكانية تحديد العمر، نوع الصوت، والأسلوب. هذه المزايا تمنح المستخدم تحكمًا واسعًا في المخرجات الصوتية. وتؤكد علي بابا أن النموذج يتفوق على واجهة OpenAI الخاصة بـ GPT-4o mini-tts، بحسب تقرير موقع SCMP.

Qwen3-TTS-VC-Flash: استنساخ الأصوات بـ10 لغات

النموذج الثاني، Qwen3-TTS-VC-Flash، يختص باستنساخ الأصوات، حيث يمكنه نسخ صوت شخص من مقطع لا يتجاوز ثلاث ثوانٍ، مع إعادة إنتاجه بعشر لغات مختلفة. ويتميز النموذج بقدرته على التعامل مع نصوص معقدة، تقليد أصوات الحيوانات، واستخراج الأصوات من التسجيلات، مع معدل أخطاء أقل مقارنةً بمنافسين مثل ElevenLabs وMiniMax.

توفر الأدوات وتجربة النسخ التجريبية

توفر النماذج الجديدة عبر واجهة برمجة التطبيقات الخاصة بعلي بابا كلاود، مع إمكانية تجربة النسخ التجريبية على منصة Hugging Face، لتلبية احتياجات الشركات والمطورين في الإعلانات، الألعاب، وصناعة الفيديو.

استخدامات واسعة وتقليل التكلفة

تفتح هذه الأدوات المجال أمام استخدامات متعددة تشمل: إنتاج الإعلانات الصوتية، الدبلجة متعددة اللغات، صناعة الشخصيات الصوتية في الألعاب، دعم التعليم الإلكتروني، وخدمات مراكز الاتصال. كما توفر توفيرًا كبيرًا في الوقت والتكلفة مقارنة بالأساليب التقليدية.

اترك ردّاً

علي بابا تطلق أدوات ذكاء اصطناعي لتوليد واستنساخ الأصوات بـ10 لغات

إطلاق نماذج جديدة من سلسلة Qwen3

Qwen3-TTS-VD-Flash: التحكم الكامل في الصوت

Qwen3-TTS-VC-Flash: استنساخ الأصوات بـ10 لغات

توفر الأدوات وتجربة النسخ التجريبية

استخدامات واسعة وتقليل التكلفة

يوسف إبراهيم

اترك ردّاًإلغاء الرد

الذكاء الاصطناعي في تشخيص السرطان: هل يقرأ الأنسجة أ...

أوبن إيه آي تتصدر السباق الدفاعي: اتفاقية البنتاجون ...

إنفيديا تستثمر 4 مليارات دولار في الفوتونيات لتعزيز ...

حملة مقاطعة شات جي بي تي تشتعل بسبب شراكة مع البنتاجون

مأساة: وفاة مهندس أمريكي بعد اعتماد كامل على شات جي ...

إطلاق نماذج جديدة من سلسلة Qwen3

Qwen3-TTS-VD-Flash: التحكم الكامل في الصوت

Qwen3-TTS-VC-Flash: استنساخ الأصوات بـ10 لغات

توفر الأدوات وتجربة النسخ التجريبية

استخدامات واسعة وتقليل التكلفة

يوسف إبراهيم

اترك ردّاًإلغاء الرد

مقالات مشابهة