صدر منتج جديد من شركة الذكاء الاصطناعي الناشئة Stability AI يسمى “انتشار الفيديو المستقر”، وهذا المنتج يتيح للمستخدمين إنشاء فيديو من صورة واحدة.
وقد كتبت الشركة قائلة: “يعتمد نموذج توليد الفيديو الذكي والمستقر على نموذج توليد الصور الذكي والمستقر، وهذا النموذج الجديد يعد خطوة مهمة في رحلتنا نحو إنشاء نماذج للجميع من جميع الأنواع”.
يتم حاليًا توفير خدمة Stable Video Diffusion كتجربة بحثية من قِبل الشركة. يجب على أولئك الذين يرغبون في استخدام هذا النموذج أن يوافقوا على شروط استخدام محددة تحدد الاستخدامات المقصودة لـ Stable Video Diffusion. يتضمن ذلك التطبيقات التعليمية والإبداعية، وليس التطبيقات التمثيلية الواقعية للأشخاص أو الأحداث.
وأوضحت شركة Stability AI أن المستخدمين المهتمين يمكنهم التسجيل في قائمة الانتظار للوصول إلى تجربة الويب المستقبلية المتميزة التي تحول النص إلى فيديو. تقدم الأداة التطبيقات المحتملة في مجالات مثل الإعلان والتعليم والترفيه وغيرها. يتم توفير منتج Stable Video Diffusion في هذه المرحلة فقط لأغراض البحث وليس للتطبيقات العملية أو التجارية.
صدرت شركة Stability AI أداة جديدة تسمح بتحويل الصور إلى فيديو، وتتوفر الأداة بشكل نموذجين، حيث يمكن لكل منهما إنشاء ما بين 14 و 25 إطارًا. تعمل هذه الأداة بسرعات متنوعة تتراوح بين 3 و 30 إطارًا في الثانية، وتتميز بدقة تبلغ 576 × 1024 بكسل.
يمكن لمنتج Stable Video Diffusion إعادة تجميع العروض المتعددة من إطار واحد بدقة، مع إدارة فعالة لمجموعات البيانات.
وصرّحت الشركة قائلة: “توصلنا إلى أن هذه النماذج تتفوق على النماذج المهمة المغلقة في دراسات تفضيلات المستخدم، وذلك عند مقارنتها بمنصات تحويل النص إلى فيديو من Runway و Pika Labs”.
الأداة تنتج مقاطع فيديو ذات جودة عالية نسبياً ومتوافقة مع أنظمة التوليد المنافسة، ولكن هناك قيود معينة. فالمنتج يولد فيديو قصيراً بمدة 4 ثوانٍ ويفتقر إلى الواقعية المثالية، ولا يمكن تحريك الكاميرا فيه، ولا يوجد تحكم في النص أو إنشاء نص مقروء، وقد لا يتم توليد الوجوه والأشخاص بشكل صحيح.
تدربت أداة Stability AI على تجميع الملايين من مقاطع الفيديو، وتم ضبطها لاحقًا باستخدام مجموعة صغيرة تتألف من مئات الآلاف من مقاطع الفيديو. أعلنت الشركة أنها تستخدم مقاطع الفيديو المتاحة للجمهور لأغراض البحث.
تُعَدُّ الفيديوهات هدفًا أساسيًّا للذكاء الاصطناعي التوليدي، نظرًا لقدرته على تسهيل عملية إنتاج المحتوى، على الرغم من وجود احتمالية كبيرة لإساءة استخدامها من خلال التلاعب العميق وانتهاك حقوق الملكية الفكرية.