نسخه ارتقایافته هوش مصنوعی ساخت آهنگ Stability AI با نام Stable Audio 2.0 معرفی شد. این ابزار به کاربران امکان میدهد تا با استفاده از توصیف متنی، آهنگهایی با طول 3 دقیقه تولید کنند.
نسخه قبلی این ابزار قادر به ساخت 90 ثانیه صدا بود، اما افزایش این زمان به 3 دقیقه گامی بزرگ محسوب میشود، زیرا بسیاری از آهنگهای امروزی در همین بازه زمانی هستند.
علاوهبر تولید آهنگ با توضیحات متنی، کاربران میتوانند یک کلیپ صوتی نمونه را نیز آپلود کنند و Stable Audio 2.0 پس از تجزیهوتحلیل آن، صدای مشابهی را تولید میکند. قانون کپیرایت برای صداهای آپلودشده اعمال میشود و تولید محتوا بر اساس آهنگهای معروف امکانپذیر نیست.
هوش مصنوعی Stable Audio با استفاده از مجموعهای از بیش از 800 هزار فایل صوتی به نام AudioSparx آموزش داده شده است. اد نیوتن-رکس، معاون سابق بخش صدای Stability AI، اندکی پس از راهاندازی Stable Audio به دلیل آموزش این مدل هوش مصنوعی بر اساس محتواهای دارای کپیرایت، این شرکت را ترک کرد.
با این وجود، Stability AI برای نسخه جدید با Audible Magic همکاری کرده است تا از فناوری تشخیص محتوای آن برای ردیابی و جلوگیری از ورود محتواهای دارای کپیرایت به پلتفرم استفاده کند. Stable Audio 2.0 بهصورت رایگان از طریق وبسایت Stability AI قابل استفاده است.