جدول المحتويات
في إعلان رائد في مؤتمر SIGGRAPH، كشفت إنفيديا عن مجموعة من التطورات في الذكاء الاصطناعي التوليدي المادي التي تعد بتغيير كيفية تفاعلنا مع العالمين الرقمي والمادي. كان أبرز ما تم كشفه في الحدث هو تقديم خدمات نيم الجزئية من إنفيديا وعمليات مرجعية ميتروبوليس من إنفيديا، والتي تعيد تعريف مشهد البيئات العمل الذكية والغامرة.
الذكاء الاصطناعي التوليدي: من النصوص إلى الواقع
في حين يعتمد الملايين بالفعل على الذكاء الاصطناعي التوليدي في مهام مثل الكتابة والتعلم، فإن أحدث ابتكارات إنفيديا تمد هذه القدرات إلى المجال المادي. تمكّن خدمات نيم الجزئية الجديدة (آلات إنفيديا الذكية) المطورين من تدريب الآلات المادية على التنقل والتعامل مع المهام المعقدة بشكل أفضل. هذه قفزة نوعية في مجال الذكاء الاصطناعي المادي، حيث تساعد المحاكاة المتقدمة وأساليب التعلم الروبوتات وأنظمة الأتمتة الصناعية على إدراك، واستنتاج، والتنقل في محيطها بشكل أكثر فعالية.
ميتروبوليس من إنفيديا: بناء وكلاء الذكاء الاصطناعي البصري التفاعلي
من بين التطورات الأساسية هي العملية المرجعية ميتروبوليس من إنفيديا، المصممة لبناء وكلاء الذكاء الاصطناعي البصري التفاعلي. تعتمد هذه العملية على إطار التعلم العميق من إنفيديا لعوالم ثلاثية الأبعاد، بما في ذلك خدمات الجزئية fVDB، وتكملها خدمات نيم الجزئية USD Code وUSD Search وUSD Validate للعمل مع وصف المشهد العالمي (OpenUSD).
تتيح هذه الخدمات الجزئية OpenUSD نيم، إلى جانب نماذج الذكاء الاصطناعي التوليدي من إنفيديا لتطوير OpenUSD، للمطورين دمج مساعدي ووكلاء الذكاء الاصطناعي التوليدي في عمليات USD. يوسع هذا من إمكانيات إنشاء وإدارة العوالم ثلاثية الأبعاد، مما يسهل إدخال وكلاء الذكاء الاصطناعي البصري الذكي في تطبيقات متعددة.
تحويل الصناعات بالذكاء الاصطناعي المادي
تم تصميم خدمات نيم الجزئية من إنفيديا لنماذج وأماكن صناعية معينة، حيث تقدم قدرات للكلام والترجمة، والرؤية، والذكاء، والرسوم المتحركة والسلوك الواقعي. تقوم هذه الخدمات الجزئية بالفعل بتحويل صناعات مثل التصنيع والرعاية الصحية من خلال تطوير المساحات الذكية مع الروبوتات، وتقنيات المصانع والمستودعات، ووكلاء الذكاء الاصطناعي الجراحي، والمركبات الذاتية القيادة.
نماذج لغة الرؤية: مستقبل وكلاء الذكاء الاصطناعي البصري
تدعم فئة جديدة من نماذج الذكاء الاصطناعي التوليدي، المعروفة بنماذج لغة الرؤية (VLMs)، وكلاء الذكاء الاصطناعي البصري التفاعلي عالي الإدراك. تربط VLMs بين الإدراك الرقمي والتفاعل مع العالم الحقيقي، مما يعزز اتخاذ القرار، والدقة، والتفاعل، والأداء في أعباء العمل للذكاء الاصطناعي المادي. يتيح ذلك إنشاء وكلاء ذكاء اصطناعي بصري قادرين على التعامل مع المهام المعقدة في بيئات صعبة، مثل المستشفيات، والمصانع، والمستودعات، والمتاجر، والمطارات، وتقاطعات المرور.
التطبيقات الواقعية: إدارة المرور في باليرمو
مثال بارز على هذه التقنية في العمل هو في باليرمو، إيطاليا، حيث قام مديرو حركة المرور في المدينة بنشر وكلاء الذكاء الاصطناعي البصري باستخدام خدمات نيم الجزئية من إنفيديا. بالتعاون مع K2K، شريك إنفيديا ميتروبوليس، قامت المدينة بدمج VLMs في وكلاء الذكاء الاصطناعي الذين يحللون بث الكاميرات الحية لحركة المرور في الوقت الحقيقي. يقدم هؤلاء الوكلاء رؤى واقتراحات سريعة ودقيقة حول كيفية تحسين عمليات المدينة، مثل تعديل توقيت إشارات المرور لإدارة الطرق بشكل أفضل.
جسر الفجوة بين المحاكاة والواقع
تعتمد العديد من الشركات المدفوعة بالذكاء الاصطناعي على نهج “المحاكاة أولاً” لمشاريع الذكاء الاصطناعي التوليدي المادي. هذا الأسلوب ذو قيمة خاصة في البيئات المعقدة مثل التصنيع ولوجستيات المصانع، حيث يجب إدارة التفاعلات المعقدة بين العاملين والمنشآت المتقدمة بكفاءة. تقوم برامج وأدوات ومنصات إنفيديا للذكاء الاصطناعي المادي، بما في ذلك VLMs وخدمات نيم الجزئية fVDB، بتبسيط الهندسة المطلوبة لإنشاء تمثيلات رقمية دقيقة أو بيئات افتراضية.
يقدم توليد البيانات الاصطناعية، الذي تيسره أدوات مثل NVIDIA Omniverse Replicator، بديلاً قويًا لمجموعات البيانات الواقعية. يُسرّع هذا النهج من إنشاء مجموعات بيانات متنوعة وقوية لتدريب نماذج الذكاء الاصطناعي المادي، مما يعزز تكيفها وأدائها عبر صناعات وحالات استخدام متعددة.
الوصول والتوافر
يمكن للمطورين استكشاف نماذج الذكاء الاصطناعي المتقدمة وخدمات نيم الجزئية على ai.nvidia.com. بالإضافة إلى ذلك، تتوفر العملية المرجعية ميتروبوليس نيم على GitHub، وخدمات ميتروبوليس VIA الجزئية متاحة في معاينة المطورين. يمكن معاينة خدمات نيم الجزئية OpenUSD عبر كتالوج API من إنفيديا.
لمزيد من التعمق في كيفية تحول الحوسبة المسرعة والذكاء الاصطناعي التوليدي للصناعات، شاهد محادثات مؤسس إنفيديا والرئيس التنفيذي جنسن هوانغ من مؤتمر SIGGRAPH.
الخاتمة
تعد أحدث ابتكارات إنفيديا في الذكاء الاصطناعي التوليدي المادي وخدمات نيم الجزئية بتحويل كيفية تفاعلنا مع البيئات الرقمية والمادية. من خلال تمكين المطورين بأدوات وعمليات متقدمة، تمهد إنفيديا الطريق لوكلاء ذكاء اصطناعي أكثر ذكاءً وكفاءة وتفاعلاً يمكنهم إحداث ثورة في مختلف الصناعات.
المصدر: نفيديا