جدول المحتويات
أعلن مؤسس شركة Xiaomi، لي جون، عن إنجاز بارز في مختبر الذكاء الاصطناعي الخاص بالشركة، حيث تم قبول عدة أوراق بحثية من فريق Xiaomi في مؤتمر ICLR 2026 (المؤتمر الدولي لتمثيلات التعلم)، الذي يُعتبر من أبرز المؤتمرات العالمية في مجال الذكاء الاصطناعي.
تتناول الأعمال المختارة مجالات حيوية في الذكاء الاصطناعي الحديث، بما في ذلك التفكير متعدد الأنماط، التعلم المعزز، وكلاء واجهة المستخدم، وتوليد الصوت، وأحد أبرز المواضيع هو القيادة الذاتية من النهاية إلى النهاية.
بحث مميز: DIPOLE (تحسين سياسة الانتشار الثنائي)
تُعتبر الورقة البحثية بعنوان “تحسين سياسة الانتشار الثنائي” من بين الأعمال المقبولة، حيث تبرز تطبيقاتها المباشرة على أنظمة القيادة الذاتية ونماذج اتخاذ القرار على نطاق واسع.
التحدي: الاستقرار مقابل التعقيد تُعتبر الاستراتيجيات المعتمدة على الانتشار معيارًا ذهبيًا للمهام التوليدية نظرًا لقوتها التعبيرية العالية وقابليتها للتحكم. ومع ذلك، فإن تطبيقها في التعلم المعزز لاتخاذ القرار يخلق عنق زجاجة:
- التحسين المباشر غالبًا ما يؤدي إلى عدم استقرار في التدريب.
- التقريبات الغاوسية تتطلب موارد حسابية كبيرة وتحتاج إلى خطوات إزالة الضوضاء المفرطة، مما يجعلها غير عملية للتطبيقات الزمنية الحقيقية مثل القيادة الذاتية.
الحل: خوارزمية DIPOLE
يقترح فريق البحث في Xiaomi، بقيادة المؤلفين المشاركين ليانغ روي مينغ وزينغ يينان، خوارزمية DIPOLE (تحسين سياسة الانتشار الثنائي).
- المنطق الأساسي: تعيد الخوارزمية فحص هدف التعلم المعزز المنظم بواسطة KL. بدلاً من تحسين معقد، تقدم “تنظيم سياسة جشعة”.
- التحليل الثنائي: تقوم بتفكيك السياسة المثلى إلى هيكل “ثنائي” – أحدهما يزيد المكافآت والآخر يقللها.
- تحكم الاستدلال: أثناء التنفيذ الفعلي، يولد النظام إجراءات من خلال دمج خطي لدرجات الاحتمالية لهذه السياسات المتعارضة، مما يسمح بتعديل مرن لمدى “جشع” أو محافظ اتخاذ القرار.
التحقق من الأداء والأثر
لا تقتصر خوارزمية DIPOLE على الجانب النظري. حيث تم التحقق من أدائها عبر ثلاثة معايير حيوية:
- التعلم المعزز العام: تحسن كبير في المعايير القياسية مثل ExORL وOGBench.
- قابلية التوسع: تم التحقق بنجاح على نماذج VLA (الرؤية-اللغة-الإجراء) مع نطاقات معلمات تصل إلى مليار، مما يثبت فعاليتها على نماذج الأساس الكبيرة.
- القيادة الذاتية: أظهرت الخوارزمية أداءً متفوقًا في NAVSIM، وهو معيار حقيقي للقيادة الذاتية، مما يشير إلى تحسينات مباشرة في أنظمة Pilot المستقبلية لشركة Xiaomi.
المصدر: Lei Jun Weibo
رأي بوابة الذكاء الاصطناعي
تُظهر خوارزمية DIPOLE تقدمًا ملحوظًا في معالجة تحديات القيادة الذاتية، حيث تجمع بين الاستقرار والكفاءة. إن القدرة على تحسين اتخاذ القرار في الوقت الحقيقي تعكس التزام Xiaomi بالابتكار في مجال الذكاء الاصطناعي. كيف ترى تأثير هذه التطورات على مستقبل القيادة الذاتية في السيارات؟
المصدر: الرابط الأصلي