باختصار
- يمثل Muse Spark الجديد من Meta تحولاً نحو الذكاء الاصطناعي المغلق والمتعدد الوسائط الأصلي مع الاستدلال القائم على الوكلاء.
- تُبلغ Meta عن مكاسب قياسية قوية في الصحة والبحث، لكنها لا تزال تتخلف عن Gemini في الاستدلال الأساسي والترميز.
- تم بناؤه في تسعة أشهر بقدرة حوسبة أقل بكثير، مما يشير إلى استراتيجية جديدة قائمة على الكفاءة في الذكاء الاصطناعي.
أطلقت Meta نموذج Muse Spark يوم الأربعاء، مما يمثل أول نموذج تم بناؤه بواسطة Meta Superintelligence Labs - الفريق الذي تم تجميعه قبل تسعة أشهر تحت قيادة كبير مسؤولي الذكاء الاصطناعي Alexandr Wang بعد استحواذ Meta على Scale AI بقيمة 14 مليار دولار. وهو متاح الآن على meta.ai وتطبيق Meta AI، مع طرحه على Facebook وInstagram وWhatsApp في الأسابيع القادمة.
هذا ليس مجرد ترقية أخرى لروبوت الدردشة أو نسخة جديدة من Llama. Muse Spark متعدد الوسائط بشكل أصلي - فهو يعالج الصور والنصوص والصوت من الأساس، بدلاً من إضافة الرؤية إلى نموذج نصي موجود. يأتي مع سلسلة التفكير المرئية ودعم استخدام الأدوات وشيء تسميه Meta "وضع التأمل": إعداد يشغل وكلاء ذكاء اصطناعي متعددة بالتوازي لمعالجة المشكلات الأصعب. هذه هي إجابة Meta لأوضاع التفكير الممتدة من Gemini Deep Think من Google وGPT Pro من OpenAI.
"Muse Spark هو الخطوة الأولى على سلم التوسع لدينا والمنتج الأول لإصلاح شامل من الأساس لجهودنا في الذكاء الاصطناعي"، كتبت Meta في إعلان رسمي. "لدعم المزيد من التوسع، نقوم بإجراء استثمارات استراتيجية عبر المجموعة بأكملها - من البحث والتدريب النموذجي إلى البنية التحتية، بما في ذلك مركز بيانات Hyperion."
عملت الشركة مع أكثر من 1,000 طبيب لتنظيم بيانات التدريب للاستدلال الطبي لـ Muse Spark. النتائج على HealthBench Hard - معيار الاستعلامات الصحية المفتوحة - مذهلة: سجل Muse Spark 42.8، مقارنة بـ 40.1 لـ GPT 5.4 و20.6 فقط لـ Gemini 3.1 Pro. هذا ليس فرقاً هامشياً.
في البحث القائم على الوكلاء (DeepSearchQA)، يتصدر Muse Spark أيضاً بـ 74.8، متفوقاً على Gemini (69.7) وGPT 5.4 (73.6). في CharXiv Reasoning - فهم الأشكال من الأوراق العلمية - سجل 86.4، وهو الأعلى بين النماذج في المقارنة.
بالنسبة لأولئك المهتمين بكسر حماية الذكاء الاصطناعي، تم اختراق النموذج في غضون دقائق:
لكن الجيد ليس هو نفسه الرائع. تُظهر الصورة القياسية الإجمالية أن Gemini 3.1 Pro لا يزال يتقدم في معظم الفئات. الفجوة أكثر وضوحاً في ARC AGI 2، معيار لغز الاستدلال المجرد: سجل Gemini 76.5 مقابل 42.5 لـ Muse Spark.
في الترميز (LiveCodeBench Pro)، يتفوق Gemini بـ 82.9 على Meta بـ 80.0. في MMMU Pro - الفهم متعدد الوسائط - سجل Gemini 83.9 مقابل 80.4. تعترف مدونة Meta الخاصة بفجوات الأداء الحالية في أنظمة الوكلاء طويلة المدى وسير عمل الترميز.
هناك أيضاً تحول استراتيجي ملحوظ مدمج في هذا الإطلاق. Muse Spark هو نموذج مغلق - لن يتم نشر بنيته وأوزانه للجمهور. هذا يمثل تحولاً حاداً عن Llama، الذي بنى سمعة Meta في دوائر الذكاء الاصطناعي المفتوحة. بعد الاستقبال الضعيف لـ Llama 4 في وقت سابق من هذا العام، يبدو أن Meta قررت أن الفصل التالي يحتاج إلى كتابته بشكل مختلف.
تقول الشركة إنها تأمل في جعل الإصدارات المستقبلية من Muse مفتوحة المصدر، لكن في الوقت الحالي يبقى الكود داخل Meta. ارتفع سهم عملاق التكنولوجيا بنسبة 9% تقريباً يوم الأربعاء بعد الإعلان، وأنهى يوم التداول بارتفاع 6.5% إلى سعر 612.42 دولار.
يستخدم "وضع التأمل" تنسيق الوكلاء المتوازي لدفع سقف النموذج إلى الأعلى. في تلك التكوين، حقق Muse Spark 58% في Humanity's Last Exam و38% في FrontierScience Research - منطقة تجعله تنافسياً مع الإصدارات الأكثر قدرة من Gemini وGPT، بدلاً من إصداراتها القياسية.
تطرح Meta أيضاً مساعد تسوق يقارن المنتجات ويربط مباشرة بالمشتريات، وتخطط لجلب Muse Spark إلى Facebook وInstagram وWhatsApp في الأسابيع المقبلة - باتباع نفس النهج المنفذ منذ Llama 3، مما يضعه أمام أكثر من 3.5 مليار مستخدم. يتم فتح معاينة واجهة برمجة تطبيقات خاصة لمطورين محددين.
تم بناء النموذج في تسعة أشهر، بالاسم الكودي الداخلي Avocado، مع ادعاء Meta أن مجموعة التدريب المسبق الجديدة يمكن أن تصل إلى نفس مستوى القدرة مثل Llama 4 Maverick باستخدام أقل من 10 مرات من الحوسبة.
يوصف Muse Spark داخلياً بأنه خطوة أولى "صغيرة وسريعة" في عائلة Muse. نسخة أكثر قدرة قيد التطوير بالفعل.
نشرة الإحاطة اليومية
ابدأ كل يوم بأهم القصص الإخبارية الآن، بالإضافة إلى ميزات أصلية وبودكاست ومقاطع فيديو والمزيد.
المصدر: https://decrypt.co/363691/meta-muse-spark-most-capable-ai-gemini-pro-still-leads








