جدول المحتويات
النقاط الرئيسية
- أطلقت شركة بايدو نموذج التعرف الضوئي على الحروف PP-OCRv5، المتاح الآن على منصة Hugging Face.
- يتميز النموذج بكفاءة عالية، حيث يحتوي على 0.07 مليار معلمة فقط.
- يمكنه معالجة أكثر من 370 حرفًا في الثانية على معالج Intel Xeon.
- يدعم النموذج أكثر من 40 لغة، بما في ذلك الصينية المبسطة والتقليدية واليابانية.
التفاصيل
أعلنت شركة بايدو عن إطلاق نموذج PP-OCRv5، وهو نموذج متقدم للتعرف الضوئي على الحروف، متاح الآن على منصة Hugging Face. يتميز النموذج بقدرته على قراءة النصوص بدقة عالية مع الحفاظ على خفة وزنه، حيث يحتوي على 0.07 مليار معلمة، مما يجعله أقل حجمًا مقارنةً بالنماذج الكبيرة الأخرى في هذا المجال.
يعمل PP-OCRv5 على مرحلتين رئيسيتين: الأولى تتعلق بتحديد مواقع النصوص في الصورة، والثانية تتعلق بقراءة النصوص نفسها. وقد أظهرت الاختبارات أن النموذج يتفوق على نماذج مثل GPT-4o وGemini 2.5 Pro في مهام التعرف الضوئي على الحروف، حيث يمكنه التعامل مع النصوص المطبوعة والمكتوبة بخط اليد بكفاءة.
لماذا هذا الخبر مهم؟
يمثل PP-OCRv5 خطوة مهمة في تطوير تقنيات التعرف على النصوص، حيث يوفر حلاً فعالًا للمطورين والشركات التي تتعامل مع مستندات متعددة اللغات. بفضل خفته وكفاءته، يمكن استخدامه على أجهزة الكمبيوتر العادية أو الأجهزة الطرفية، مما يسهل عملية معالجة البيانات دون الحاجة إلى بنى تحتية ضخمة.
خلفية سريعة
تعتبر بايدو من الشركات الرائدة في مجال الذكاء الاصطناعي، وقد أطلقت مؤخرًا نموذج Ernie X1.1. مع إطلاق PP-OCRv5، تواصل بايدو تعزيز مكانتها في سوق تقنيات التعرف على النصوص، مما يعكس التزامها بتقديم حلول مبتكرة تلبي احتياجات المستخدمين والمطورين في عصر البيانات المتزايدة.
المصدر: الرابط الأصلي