تمكن نموذج الذكاء الاصطناعي Claude 3 Opus من تحقيق إنجاز كبير عندما احتل المرتبة الأولى في قائمة تصنيف النماذج اللغوية الكبيرة، وتجاوز بذلك منافسيه GPT-4 من شركة OpenAI لأول مرة.
بالمقابل من منصات تقييم الذكاء الاصطناعي الأخرى التي تعتمد على معايير تقنية معقدة، تعتمد منصة “شات بوت أرينا” على تصويت المستخدمين لتحديد النموذج الأفضل.
يُعرض على الأفراد منتجات مختلفة من نموذجين للذكاء الاصطناعي، ويقوم الشخص بتقييم كل واحد منهما استنادًا إلى تفضيلاته الشخصية، مثل جودة النصوص المُولدة أو طريقة الاستجابة للأسئلة المطروحة.
بمجرد إصدار نموذج GPT-4 ، احتل المرتبة الأولى في قائمة التصنيف منذ إطلاقه العام الماضي، لدرجة أن أي نموذج يظهر أداء مشابه يعتبر جزءًا من “فئة GPT-4”. ومع ذلك، تمكن Claude 3 Opus من تحقيق نتيجة مثيرة للاهتمام ومتقاربة تقريبا مع GPT-4، مما يشير إلى وجود منافسة شديدة في مجال نماذج الذكاء الاصطناعي الكبيرة.