كشف فريق “Qwen” التابع لشركة علي بابا عن مجموعة نماذج ذكاء اصطناعي تحمل اسم “Qwen2.5-VL”، قادرة على تحليل النصوص والصور، وفهم مقاطع الفيديو، والتفاعل مع التطبيقات على الهواتف والحواسيب.
تفوق تقني على المنافسين
يتفوق النموذج الرئيسي “Qwen2.5-VL” على نماذج مثل “GPT-4o” من “OpenAI” و”Gemini 2.0 Flash” من “غوغل” في تقييمات فهم الفيديو والرياضيات وتحليل المستندات. ويُتاح النموذج للتنزيل عبر منصة “Hugging Face”.
ميزات متطورة
يتميز “Qwen2.5-VL” بقدرته على:
- تحليل الرسوم البيانية والبيانات من الصور الضوئية.
- فهم مقاطع الفيديو طويلة المدة.
- التفاعل مع تطبيقات الهواتف وأجهزة الكمبيوتر، بما في ذلك حجز الرحلات عبر تطبيقات مثل “Booking”.
نماذج إضافية
تشمل العائلة نموذجين آخرين أقل تطورًا هما “Qwen2.5-VL-3B” و”Qwen2.5-VL-7B”، مما يوسع الخيارات أمام المستخدمين.
المنافسة مع “DeepSeek”
تأتي هذه الخطوة في ظل منافسة محلية قوية مع مختبر الذكاء الاصطناعي الصيني “DeepSeek”، الذي حاز على اهتمام كبير مؤخرًا.




