نموذج جديد للبحث العميق من StepFun AI
أطلقت شركة StepFun AI نموذجًا متقدمًا يُدعى Step‑DeepResearch، وهو وكيل بحث شامل من نوع end-to-end يحتوي على 32 مليار معاملة، ويستند إلى قاعدة Qwen2.5-32B-Base. يهدف النموذج إلى تحويل البحث التقليدي على الويب إلى سير عمل بحثي متقدم يشمل التفكير طويل الأفق، استخدام الأدوات، وإعداد تقارير منظمة مع الاستشهادات، مع الحفاظ على تكلفة استدلال منخفضة نسبيًا مقارنة بالنماذج الكبيرة الأخرى.
هيكل البحث العميق داخل وكيل واحد
يعيد النموذج صياغة البحث العميق كعملية اتخاذ قرار تسلسلية تعتمد على أربع قدرات أساسية (atomic capabilities):
- التخطيط وتفكيك المهمة
- البحث العميق عن المعلومات
- التأمل والتحقق
- إنتاج التقارير المهنية
بدلاً من الاعتماد على عدة وكلاء خارجيين، يدمج النموذج هذه العمليات داخليًا في وكيل واحد يقرر الخطوة التالية في كل مرحلة.
بناء البيانات والتدريب الموجه نحو القدرات الأساسية
وفقًا لموقع MarkTechPost، قام فريق البحث ببناء خطوط بيانات منفصلة لكل قدرة أساسية:
- التخطيط: استخراج خطط بحث واقعية من تقارير فنية وأوراق مسحية وتحليلات مالية، وتوليد مسارات تتبع لهذه الخطط.
- البحث العميق: إنشاء استفسارات قائمة على الرسوم البيانية عبر قواعد معرفية مثل Wikidata5m وCN-DBpedia، مع التركيز على الأسئلة التي تتطلب استردادًا متعدد الوثائق.
- التأمل والتحقق: توليد بيانات عبر حلقات تصحيح ذاتي وتتبعات متعددة الوكلاء.
- إنتاج التقارير: تدريب على مراحل مع التركيز على التنسيق الدقيق والاستشهادات، من خلال ثلاث مراحل:
- Mid-training: إدخال القدرات الأساسية (حتى 150 مليار توكن مع سياق 32k ثم 128k).
- Supervised fine-tuning: تركيب مسارات البحث الكاملة.
- Reinforcement learning: تحسين التقارير باستخدام PPO ومحكم Rubrics وفق معايير دقيقة.
هندسة ReAct مع مكدس بحث مختار وذاكرة خارجية
يعمل النموذج عند الاستدلال كنظام ReAct واحد يتناوب بين التفكير، استدعاء الأدوات، والملاحظات حتى إصدار التقرير النهائي. تشمل الأدوات:
- البحث الجماعي على الويب
- مدير المهام
- أوامر الشل وعمليات الملفات داخل sandbox
يستخدم النموذج مكدس بحث API يغطي أكثر من 20 مليون ورقة بحثية و600 مؤشر متميز، مع تصنيف سلطة لأكثر من 600 نطاق موثوق (حكومي، أكاديمي، مؤسسي). لتجنب تجاوز السياق، يعتمد على تخزين ذكي باستخدام الملخصات وتحرير التصحيحات الجزئية للملفات، مما يوفر ذاكرة خارجية فعالة للمشاريع طويلة المدى.




