أعلنت شركة Stability AI، الشركة الرائدة في مجال الذكاء الاصطناعي، عن إطلاق نموذج جديد لتوليد الأصوات مفتوح المصدر، وقد أطلقت عليه اسم “Stable Audio Open”.
وأوضحت الشركة في بيانها الرسمي أن هذا النموذج تم تدريبه باستخدام تسجيلات خالية من حقوق الملكية، مع استناده إلى حوالي 486 ألف عينة من مكتبات الأصوات المفتوحة المصدر مثل FreeSound و Free Music Archive.
يعمل نموذج “الصوت المستقر المفتوح” على تحويل النصوص إلى تسجيلات صوتية تصل إلى 47 ثانية، وتقول الشركة إن هذا النموذج يمكن استخدامه لإنشاء أصوات لأغراض متنوعة، بما في ذلك الأفلام والبرامج التلفزيونية.
وأشارت شركة Stability AI إلى أن أحد الفوائد الرئيسية لهذا الإصدار مفتوح المصدر هو إمكانية تحسين المستخدمين للنموذج من خلال استخدام بياناتهم الصوتية الشخصية. على سبيل المثال، يمكن للمستخدم تحسين النموذج من خلال عينات من تسجيلاته الخاصة لإنشاء أصوات جديدة مبنية عليها.
تنصح الشركة المستخدمين الذين يحتاجون إلى زيادة في القدرات على إنتاج الأصوات بالاستفادة من خدمتها الخاصة “Stable Audio”.
النموذج “Stable Audio Open” غير قابل للاستخدام لأغراض تجارية وفقًا لشروط الخدمة الخاصة به، ولا يعمل بكفاءة مع المطالبات النصية بلغات غير الإنجليزية أو عند توليد مقاطع صوتية غير متوافقة مع بيانات التدريب.
واجهت شركة Stability AI تحديات في الفترة الأخيرة في تطوير منتجاتها، خاصة بعد استقالة نائب رئيس الصوت التوليدي، إد نيوتن ريكس، الذي ادعى أن الشركة تقوم بتدريب نماذج الذكاء الاصطناعي التوليدي على الأعمال المحمية بحقوق الطبع والنشر.
تهدف الشركة من خلال إطلاق هذا النموذج الجديد إلى حماية نفسها من الاتهامات التي توجه إليها، وتعزيز خدماتها المتقدمة في إنتاج الأصوات بالذكاء الاصطناعي.
وكانت شركة سوني قد أرسلت في شهر مايو الماضي رسالة إلى مئات الشركات في مجال الذكاء الاصطناعي التوليدي، تحذرها من “استخدام غير قانوني” لمحتواها لتدريب مولدات الصوت.