أعلنت شركة إنفيديا خلال مؤتمر GTC لعام 2024 عن إطلاق منصة برمجية حديثة، تهدف إلى تسهيل عملية نشر النماذج الخاصة بالذكاء الاصطناعي والتي تم تدريبها مسبقًا بغرض استخدامها في بيئات الإنتاج المعروفة بـ NIM.
تعمل NIM على استخدام البرمجيات التي طورتها نفيديا لعمليات الاستنتاج وتطوير الأنماط، وتيسر استخدامها عبر دمج نموذج محدد مع محرك استنتاج محسّن، ثم تغليفهما معًا في مجموعة واحدة، ما يجعلها قابلة للوصول كخدمة متخصصة ومرنة.
عادة ما يحتاج المطورون إلى عدة أسابيع أو أشهر لتطوير حزم برمجية مقاربة إذا كانت الشركة تمتلك فريقاً متخصصاً بالذكاء الاصطناعي داخلياً.
تسعى إنفيديا من خلال مبادرة NIM إلى تأسيس بيئة من الحلول الجاهزة لتطبيقات الذكاء الاصطناعي التي تعتمد على تقنياتها كطبقة أساس، وتتيح هذه الوحدات البرمجية المتكاملة باعتبارها اللب البرمجي للمؤسسات الطامحة إلى تعزيز تقدمها في مجال الذكاء الاصطناعي بشكل سريع.
تشتمل NIM في الوقت الراهن على دعم لأنواع النماذج الخاصة بشركة إنفيديا والتي تشمل A121 و Adept، بجانب دعم نماذج شركتي Cohere و Getty Images و Shutterstock، فضلاً عن النماذج المفتوحة المصدر من شركات مثل جوجل وميتا ومايكروسوفت، إلى جانب نماذج من ميسترال و Hugging Face و Stability AI.
تتعاون شركة إنفيديا مع كل من جوجل ومايكروسوفت وأمازون لجعل هذه الخدمات الصغيرة NIM متاحة من خلال SageMaker و Kubernetes Engine و Azure AI، وذلك بدمجها في إطارات برمجية مثل Deepset و LangChain و LlamaIndex.
صرح مانوفير داس، المدير التنفيذي لوحدة الحوسبة الخاصة بالشركات في إنفيديا، قائلاً: “نحن نؤمن بأن وحدات معالجة الرسوميات التابعة لإنفيديا تُمثل البيئة المثالية لتنفيذ الاستنتاجات على هذه النماذج الحاسوبية. كما نعتبر أن NIM هي أفضل باقة تطبيقات تُقدم للمطورين لكي يستخدموها كأساس لأعمالهم، مما يتيح لهم التركيز على تطبيقات الشركات”.
تقوم شركة إنفيديا باستعمال خوادم الاستنتاج Triton و TensorRT و TensorRT-LLM في محرك الاستدلال الخاص بها. كما تُقدم مجموعة من الخدمات المدمجة التي يمكن الوصول إليها من خلال شبكة NIM، التي تشمل خدمة تطوير نماذج النطق والترجمة Riva، وخدمة تحسين الطرق cuOpt، بالإضافة إلى خدمة المحاكاة للأحوال الجوية والمناخية Earth-2.
تنوي الشركة مع تقدم الوقت إضافة مزايا جديدة، وذلك يتضمن توفير وحدة تشغيل النموذج اللغوي الضخم لاستعادة البيانات المطورة RAG LLM كخدمة مصغرة من خلال NIM، الأمر الذي يبشر بتيسير إنشاء روبوتات المحادثة التي تعتمد على الذكاء الاصطناعي والقادرة على جلب البيانات المعدلة خصيصًا.
من ضمن المستعملين الحاليين لـ NIM يمكننا الإشارة إلى شركات مثل Box و Cloudera و Cohesity وDatastax و Dropbox و NetApp.