اعلنت الصين عن “فيدو”، وهو نموذج متقدم للذكاء الاصطناعي يحول النصوص إلى مقاطع فيديو، خلال منتدى تشونغقوانتسون 2024 في بكين. هذا النظام قادر على إنتاج فيديوهات مدتها 16 ثانية بجودة عالية وبدقة تصل إلى 1080 بكسل بضغطة زر واحدة.
يشكل “فيدو”، الناتج عن شراكة بين جامعة تسينغهوا وشركة شنغشو الصينية المتخصصة في مجال تقنيات الذكاء الاصطناعي، النموذج الأولي الرائد في مجال الذكاء الاصطناعي المخصص للفيديو، متميزًا بخصائص تشمل مدى زمني موسع واتساق متقن بشكل استثنائي، إلى جانب قابليات متحركة وديناميكية.
كونه نظام ذكاء اصطناعي متطور وضخم تم تطويره في الصين، يمتلك “فيدو” القدرة على استيعاب المحتويات الصينية كالباندا والتنين الصيني وتفسيرها، وفقاً لما ذكره تشو جيون، الذي يشغل منصب نائب مدير لمعهد الذكاء الاصطناعي في جامعة تسينغهوا.
ذكرت الشركة أنه قد تم طرح اقتراح لإنشاء الهيكل الأساسي للنموذج في أوائل عام 2022.