جدول المحتويات
مي مو-إمبوديد: نموذج ثوري في الذكاء الاصطناعي من شاومي
في خطوة تمثل علامة فارقة في تطوير النظام البيئي الذكي لشركة شاومي والمجتمع الأوسع للبحث في الذكاء الاصطناعي، أطلقت شاومي رسميًا نموذجها الكبير "مي مو-إمبوديد" (MiMo-Embodied) وفتحت مصدره بالكامل. مع تزايد الذكاء المدمج في المنازل وزيادة قبول القيادة الذاتية، تسعى شاومي الآن للتغلب على تحدٍ طويل الأمد: تطوير التوافق المعرفي والقدرات بين الروبوتات الداخلية والمركبات الخارجية. من خلال "مي مو-إمبوديد"، تقدم شاومي نموذجًا أساسيًا موحدًا يعزز القيادة الذاتية والذكاء المدمج وقدرات الذكاء الاصطناعي العامة ضمن إطار عمل واحد.
ما الذي يجعل مي مو-إمبوديد نموذجًا ثوريًا؟
تعتبر شاومي أن "مي مو-إمبوديد" هو الأول من نوعه في الصناعة كنموذج أساسي مدمج يربط الفجوات بين القيادة الذاتية والذكاء المدمج. يجمع هذا النموذج بين تفسير المهام، والإدراك، واتخاذ القرار في كل من سيناريوهات المنزل والتنقل، مما يضع أساسًا علميًا قويًا لأنظمة الذكاء الاصطناعي المستقبلية عبر مجالات متعددة. يمثل هذا التحرك توسيعًا لطموحات شاومي لتتجاوز الإلكترونيات الاستهلاكية إلى الروبوتات المتقدمة والأتمتة على نطاق واسع.
المبادئ التقنية الأساسية وراء النموذج
يتميز "مي مو-إمبوديد" بتصميم معماري عميق يدعم الإدراك متعدد السيناريوهات. يركز النموذج على تنسيق المهام المدمجة، والتي تشمل التفكير المكاني وتخطيط المهام، مع مهام القيادة مثل الإدراك وتوليد المسارات. تمكّن هذه المقاربة الموحدة شاومي من الانتقال من الذكاء المتخصص إلى التعاون الذكي القابل للتوسع عبر المجالات.
ثلاث ميزات رئيسية للتكنولوجيا
تغطية شاملة للقدرات عبر المجالات
يدعم النموذج بشكل مشترك ثلاث مهام حاسمة في مجال الذكاء المدمج، وهي التفكير في الإمكانيات، وتخطيط المهام، والفهم المكاني، بالإضافة إلى ثلاث مهام أساسية في القيادة الذاتية: إدراك البيئة، وتوقع الحالة، وتخطيط القيادة. تشكل هذه القدرات معًا ذكاءً سيناريويًا كاملاً يغطي البيئات المنزلية، والروبوتات الداخلية، وحركة المرور في العالم الحقيقي.
الذكاء التعاوني ثنائي الاتجاه
تؤكد شاومي أن "مي مو-إمبوديد" يتيح نقل المعرفة بين الروبوتات الداخلية والقيادة الذاتية. خلال اختبار النظام، أظهرت النتائج أن تحسين مهارات اتخاذ القرار في الروبوتات المنزلية يمكن أن يحسن الأداء في القيادة على الطرق، والعكس صحيح. يخلق هذا التعزيز الثنائي إطارًا جديدًا للأنظمة الذكية المتكاملة.
تحسين شامل لسلسلة القيمة للنشر في العالم الحقيقي
لضمان موثوقية النشر، صممت شاومي خط تدريب متعدد المراحل يتضمن تعلم القدرات، وتعزيز الاستدلال من خلال سلسلة الأفكار (CoT)، وضبط التعلم المعزز (RL). تعزز هذه المقاربة متانة النموذج في البيئات الحقيقية، مما يجعله مناسبًا للسيناريوهات المعقدة والديناميكية.
الأداء عبر 29 معيارًا
تدعي شاومي أن "مي مو-إمبوديد" قد تفوق على النماذج الرائدة المفتوحة المصدر، والمغلقة المصدر، والملكية في 29 معيارًا حاسمًا.
نتائج الذكاء المدمج
حقق النموذج أداءً متفوقًا في 17 معيارًا، مما يدل على مهارات استثنائية في تخطيط المهام، والفهم المكاني، وتوقع الإمكانيات.
نتائج القيادة الذاتية
حقق "مي مو-إمبوديد" نتائج رائدة في 12 معيارًا، تتراوح من الإدراك إلى توقع الحالة إلى تخطيط القيادة، مما يضع معيارًا جديدًا للذكاء في القيادة متعددة المراحل.
الفهم العام للرؤية واللغة
أظهر "مي مو-إمبوديد" أيضًا تقدمًا في التعميم في المهام المتعلقة بالرؤية واللغة، مما يؤكد مرونته عبر مجالات الذكاء الاصطناعي الأوسع.
شاومي تفتح النموذج بالكامل للمطورين والباحثين
فتحت شاومي النموذج وقاعدة الشيفرة الخاصة بـ "مي مو-إمبوديد"، مما يعزز التزام الشركة بالبحث الشفاف والتعاوني. يمكن للمطورين استكشاف النموذج وتكييفه وبناء عليه من خلال المستودعات الرسمية. من خلال فتح "مي مو-إمبوديد"، تسعى شاومي إلى تسريع الابتكار في مجال الروبوتات الذكية، والتنقل الذكي، والأنظمة المتصلة.
في الختام، يمثل "مي مو-إمبوديد" خطوة كبيرة نحو مستقبل الذكاء الاصطناعي، حيث يجمع بين القيادة الذاتية والذكاء المدمج في إطار عمل موحد، مما يفتح آفاقًا جديدة للابتكار والتطوير في هذا المجال.
المصدر: الرابط الأصلي