أعلنت إنفيديا عن نموذج جديد للذكاء الاصطناعي يسمى LATTE3D لإنتاج الأشكال ثلاثية الأبعاد.
يقوم النموذج الجديد بتحويل النصوص إلى تماثيل ثلاثية الأبعاد واقعية للأشياء والحيوانات في وقت قصير جدًا.
يقدم هذا النموذج أشكالًا مولدة بتنسيق شائع يمكن استخدامه في تطبيقات نمذجة الرسومات القياسية، مما يتيح إمكانية إضافتها في البيئات الافتراضية.
تتطابق نتائج النموذج مع عدة مجالات مثل الألعاب الفيديو والحملات الإعلانية ومشاريع التصميم وساحات التدريب الافتراضية للروبوتات وعوالم الواقع الافتراضي، حسبما أفاد باحثو نفيديا.
يعتبر LATTE3D تقدمًا كبيرًا، حيث كانت النماذج المتقدمة لتحويل النص إلى صور ثلاثية الأبعاد قبل عام واحد تحتاج إلى ساعة كاملة لإنتاج صور بنفس الجودة.
بينما كان من الممكن سابقًا للنماذج أن تفعل ذلك في 12 ثانية فقط، يمكن الآن للمبدعين في مختلف الصناعات تحويل النص إلى أشكال ثلاثية الأبعاد في الوقت الحقيقي.
وفقًا لشركة إنفيديا، يمكن للنموذج الجديد إنتاج أشكال ثلاثية الأبعاد مفصلة بشكل تقريبي فور تشغيله عن طريق وحدة معالجة رسومات واحدة، مثل Nvidia RTX A6000.
تعمل LATTE3D على تغيير قواعد اللعبة بالنسبة للمصممين، حيث يمكن لهم الآن استخدام النموذج لإنتاج أفكار متعددة للأشكال على الفور بدلاً من قضاء وقت طويل في البحث عن الأصول ثلاثية الأبعاد في المكتبة.
يتم إنشاء مجموعة صغيرة من الأشكال ثلاثية الأبعاد لكل رسالة نصية، مما يمنح المصمم خيارات متعددة للاختيار منها.
ثم بالإمكان تحسين التصميم الذي اختاره وتحسين جودة الرسومات في غضون بضع دقائق عن طريق استخدام المطالبات النصية.
عندما يكون المصمم راضيًا عن النتائج، يمكنه تصديرها إلى تطبيق برمجي رسومي مثل Omniverse من إنفيديا. تدعم هذه المنصة إطار العمل USD لتبادل بيانات الرسومات ثلاثية الأبعاد.
تم تدريب إنفيديا LATTE3D على قاعدة بيانات تحتوي على أشكال الحيوانات والأشياء اليومية، ومع ذلك يمكن للباحثين تعديل التدريب ليشمل أنواع مختلفة من البيانات مثل المباني أو المركبات من أجل توسيع قدراته.
تم استخدام وحدات معالجة الرسوميات القديمة A100 Tensor Core من إنفيديا لتدريب النموذج، واستخدم ChatGPT من OpenAI لتعليم النموذج على فهم مجموعة متنوعة من المطالبات النصية، مما يعزز قدرته على فهم العبارات المختلفة التي قد يستخدمها شخص لوصف كائن ثلاثي الأبعاد.