قالت ميتا في تدوينة صياغة بديلة للفقرة: نموذج Llama اللغوي الضخم يتميّز بتفوقه على أغلب النماذج المستخدمة في الذكاء الاصطناعي في الوقت الراهن، وذلك إثر توفيرها لنموذج Llama 3 لمقدمي الخدمات السحابية، مثل AWS.
أعلنت الشركة عن نسختين مختلفتين من Llama 3، حيث يأتي الإصدار الأول مع 8 مليارات معلمة، بينما يشتمل الإصدار الثاني على 70 مليار معلمة.
يوفر الإصدار الجديد حاليًا إجابات تتمثل في النصوص فحسب، على الرغم من أن شركة ميتا تؤكد أن هذا التحديث يمثل تقدمًا هامًا عند مقارنته بالإصدار الذي سبقه.
أوضحت الدراسات أن اللاما 3 قدم أداء متنوعًا في استجابته للمطالب، حيث سجل بضع مواقف من عدم القبول الغير صحيح برفضه الإجابة على الاستفسارات، بالإضافة إلى أنه أبدى قدرة على التحليل والتفكير بشكل متميز.
تقوم ميتا بالإدلاء بأن Llama 3 يمتلك القدرة على فهم توجيهات إضافية وكتابة شيفرات برمجية بشكل أفضل وأمثل عما كان عليه في السابق.
تزعم شركة ميتا أن النسختين من Llama 3 لديهما القدرة على التفوق على نماذج أخرى بأحجام متشابهة، مثل نماذج جوجل Gemma وGemini وكذلك نماذج Mistral 7B وClaude 3 من شركة أنثروبيك في عدد من اختبارات المعايير القياسية.
وفي المقياس المعروف باسم MMLU، الذي يُستخدم عادةً لقياس المعرفة العامة، سجلت النسخة التي أصدرتها شركة ميتا والتي تحتوي على 8 مليارات معلمة نتائج أعلى بمراحل من نتائج كل من Gemma 7B و Mistral 7B، بينما حققت النسخة التي تحتوي على 70 مليار معلمة أداءً يفوق إلى حد ما أداء Gemini Pro 1.5.
يُشار إلى أن الاختبارات القياسية للذكاء الصناعي ليست شاملة، على الرغم من أنها تساعد في تقييم إمكانيات النموذج.
تلمح ميتا إلى أن المراجعين البشر قد منوا Llama 3 بتقييم مرتفع بالمقارنة مع الأنماط الأخرى، وهذا يتضمن نموذج GPT-3.5 الذي طورته OpenAI.
تذكر الشركة أنها قامت بتكوين مجموعة معطيات حديثة مُعدة للمُقيّمين من البشر بهدف تمثيل سياقات تطبيق لاما 3 ضمن ظروف الواقع الفعلي.
تشتمل هذه المجموعة من البيانات على سيناريوهات مختلفة، من قبيل طلب المشورة وإعداد الملخصات والكتابة الفنية.
أشارت شركة ميتا إلى أن الفريق المسؤول عن تطوير النموذج لم يكن قادرًا على الاطلاع على البيانات التقييمية الحديثة، مؤكدة أن ذلك لم يكن له تأثير على كفاءة النموذج.
ذكرت شركة ميتا في منشورها: “تشتمل هذه الباقة التقييمية على حوالي 1800 طلب تشمل ما يقرب من 12 سيناريو استخدام رئيسي، بما في ذلك طلب المشورة، الإبداع في الأفكار، التصنيف، الرد على الاستفسارات ذات الإجابات النموذجية، البرمجة، التأليف الأدبي، الاستخلاص، تمثيل الشخصيات، الرد على الأسئلة ذات الإجابات المتنوعة، الاستنتاج، إعادة صياغة المحتوى، وعمل الملخصات”.
يُتوقع أن يتمكن Llama 3 من التعامل مع حجم نماذج أكبر قادرة على فهم تتابعات طويلة من الأوامر والمعطيات، وأيضاً سيكون بإمكانه إنتاج ردود تفاعلية تشمل مختلف أنواع الوسائط، مثل إنشاء الصور أو تحويل الملفات الصوتية إلى نصوص.
تذكر ميتا أنها في الوقت الراهن تعكف على تدريب نسخ ضخمة تشتمل على أكثر من 400 بليون معيار، قادرة على استيعاب أنماط أشد تعقيداً بالمقارنة مع النسخ الأصغر للنموذج.