جدول المحتويات

تقنية Mixture-of-Experts: مستقبل الذكاء الاصطناعي المفتوح المصدر

في خطوة جريئة تعكس التطور السريع في مجال الذكاء الاصطناعي، أعلنت شركة DeepSeek AI الصينية عن إطلاق نموذجها الجديد الرائد DeepSeek-V3. يُعدّ هذا النموذج واحدًا من أقوى النماذج المفتوحة المصدر في العالم، ويعتمد على تقنية مبتكرة تُعرف بـ Mixture-of-Experts (MoE).

يحتوي النموذج على 671 مليار معلَمة، مع تفعيل 37 مليار معلَمة لكل إدخال نصي. يُذكر أن المَعلَمات (Parameters) تمثل معيارًا أساسيًا لقياس كفاءة النماذج وقوتها في أداء المهام المختلفة. بفضل هذه التقنية، استطاع DeepSeek-V3 تحقيق نتائج مذهلة في اختبارات الأداء القياسية، مما جعله يتفوق على نماذج مغلقة المصدر شهيرة مثل GPT-4o من OpenAI وClaude 3.5 من شركة Anthropic.

أداء استثنائي وتكاليف تشغيل أقل

بحسب الاختبارات، تصدر DeepSeek-V3 تسعة معايير أداء رئيسية، متفوقًا على جميع النماذج الأخرى من نفس الفئة. ومن أبرز ميزاته انخفاض تكاليف التشغيل بشكل ملحوظ؛ إذ تقدر تكلفة الإدخال فيه بأقل عشر مرات من تكلفة النماذج الرائدة الأخرى مثل GPT-4.

يتطلب تدريب النموذج حوالي 2.788 مليون ساعة باستخدام وحدات معالجة الرسوميات المتقدمة H800، وبتكلفة إجمالية تُقدَّر بنحو 5.6 ملايين دولار. بالمقارنة، فإن نموذج Llama 3 من Meta (405 مليارات معلَمة) يحتاج إلى 30.8 مليون ساعة تدريب، ما يبرز الفعالية الهندسية والتقنيات المتطورة التي تدعم DeepSeek-V3.

خطوة نحو تقليص الفجوة بين النماذج المفتوحة والمغلقة

أعرب فريق DeepSeek في بيان عبر منصة إكس (تويتر سابقًا) عن تفاؤله بهذا الإنجاز الرائد، مشيرًا إلى أن هذا النموذج يمثل خطوة كبيرة نحو تقليص الفجوة بين النماذج المفتوحة والمغلقة المصدر.

يتوفر نموذج DeepSeek-V3 للتنزيل على منصتي GitHub وHuggingFace، مما يتيح للمطورين والعلماء حول العالم الوصول إلى تكنولوجيا متقدمة بأسعار معقولة.

الابتكار في متناول الجميع

يُعدّ إطلاق DeepSeek-V3 خطوة حاسمة نحو جعل تقنيات الذكاء الاصطناعي أكثر شمولية واستدامة. مع إتاحة النموذج للجميع، يمكن أن يكون له تأثير عميق على الأبحاث والتطبيقات العملية في مختلف القطاعات، من الطب إلى التعليم والتكنولوجيا.

الخاتمة: بداية عصر جديد للنماذج المفتوحة المصدر

من خلال الأداء الرائد والتكاليف التشغيلية المنخفضة، يُعد DeepSeek-V3 شهادة حية على الابتكار الصيني في مجال الذكاء الاصطناعي. مع اعتماد تقنية Mixture-of-Experts (MoE)، يُنتظر أن يُحدث هذا النموذج قفزة نوعية في تطوير النماذج المفتوحة المصدر، مما يتيح إمكانيات غير مسبوقة لمجتمع الذكاء الاصطناعي العالمي.

في عالمٍ يتزايد فيه الاعتماد على الابتكار الرقمي، يمثل DeepSeek-V3 إشارة واضحة إلى أن النماذج المفتوحة المصدر يمكنها التنافس مع النماذج المغلقة بل وتتفوق عليها. هذا الإنجاز ليس فقط انتصارًا لشركة DeepSeek AI، بل هو أيضًا خطوة نحو مستقبل أكثر تعاونًا وشمولية في مجال الذكاء الاصطناعي.

قد تعجبك أيضاً

شراكات

منصة Bawaba AI تعمل بأدوات مدعومة من شركة مايكروسوفت تحت برنامج دعم المشاريع الناشئة.

DeepSeek-V3: نموذج ذكاء اصطناعي صيني يُحدث ثورة في النماذج المفتوحة المصدر