أعلنت شركة Stability AI عن إطلاق نموذجها الجديد Stable Diffusion 3، وهو الإصدار الأحدث والأقوى لنموذج إنتاج الصور بالذكاء الاصطناعي.
يتم تقديم النموذج الجديد كاستجابة للنماذج المنافسة من جوجل وOpenAI.
صدرت شركة Stability AI العديد من النماذج خلال العام الماضي، وتظهر تلك النماذج تطورا وجودة بارزين.
أدى إصدار SDXL في شهر يوليو إلى تحسين نموذج Stable Diffusion الأساسي بشكل كبير، وتطمح الشركة الآن إلى المضي قدمًا.
تعتمد Stable Diffusion 3 على تصميم معماري جديد ويتوافق مع مجموعة متنوعة من الأجهزة. لم تتم إطلاقه من قبل شركة Stability AI بعد، ولكن يمكنك الاشتراك في قائمة الانتظار.
يعتمد النموذج الجديد على تقنية تحويل الانتشار، والتي كانت مبتكرة في عام 2022 وتم تحسينها في عام 2023 وأصبحت الآن قابلة للتوسيع.
بالإضافة إلى ذلك، يتم استخدام تقنية تطابق الدفق Flow Matching التي تحسن الجودة دون الحاجة إلى إضافة المزيد من الموارد اللازمة لأداء مهمة معينة.
يقول عماد مشتاق، المؤسس والرئيس التنفيذي لشركة Stability AI، إن النموذج الجديد يستطيع فهم الوسائط المتعددة وإضافة ميزة توليد الفيديو.
تظل هذه الميزات نظرية حتى الآن، ولكن لا يوجد عائق تقني يمنع إدراجها في الإصدارات المستقبلية.
يهدف النموذج الجديد Stable Diffusion 3 إلى تحسين جودة الصور وتحسين أداء إنتاج الصور لمتطلبات متنوعة.
كذلك، يقدم Stable Diffusion 3 طريقة طباعة أفضل بالمقارنة مع الإصدارات السابقة من نماذج Stable Diffusion، مما يسمح بإتقان دقيق ومتسق في توليد الصور.
كانت عملية الطباعة سابقًا نقطة ضعف لنماذج الانتشار المستقر، وهي النقطة التي كان يعمل عليها المنافسون أيضًا مع الإصدارات الأخيرة مثل DALL-E 3 و Ideogram و Midjourney.
تقوم Stability AI بتطوير نموذجها الجديد Stable Diffusion 3 بأحجام متنوعة تتراوح بين 800 مليون و8 مليار معلمة، بهدف تشغيله على مجموعة واسعة من الأجهزة.
تَطَوَّرت قدرات مُثبت للذكاء الاصطناعي في إنتاج الصور ثلاثية الأبعاد وخلق فيديوهات في الشهور الأخيرة.
قالت الشركة: “نحن نقوم بإنتاج نماذج مفتوحة يمكن استخدامها في جميع الأماكن وتعديلها لتناسب أي حاجة، وتتضمن سلسلة من النماذج بأحجام مختلفة تدعم تطوير نماذجنا البصرية للأجيال القادمة”.