Stability AI'nin ses oluşturucusu artık 3 dakikalık “şarkılar” üretebiliyor.

0
Stability AI'nin ses oluşturucusu artık 3 dakikalık “şarkılar” üretebiliyor.

Kararlılık Yapay Zekası müzik oluşturma platformunun yükseltilmiş bir versiyonu. Bu sistem, kullanıcıların metin istemi yoluyla üç dakikaya kadar ses oluşturmasına olanak tanır. Bu, gerçek şarkının uzunluğuyla ilgilidir, dolayısıyla aynı zamanda bir giriş, tam akor ilerlemesi ve bir çıkış oluşturacaktır.

İlk olarak iyi haber. Üç dev dakika. Yazılımın önceki sürümü maksimum 90 saniyeye ulaşıyordu. Rob Thomas/Santana şarkısı tarzında yapabileceğiniz sahte Noel şarkısını hayal edin. Başka bir nimet mi? Araç ücretsizdir ve şirketin web sitesi aracılığıyla halka açıktır, bu nedenle kullanın.

Öncelikle kısa mesaj yoluyla çalışır, ancak ses klibi yükleme seçeneği de vardır. Sistem klibi analiz edecek ve benzer bir şey üretecektir. Yüklenen tüm ses klipleri telif hakkına tabi olmamalıdır; bu nedenle, halihazırda var olan bir şeyi taklit etme amacı taşımamalıdır. Alternatif olarak, örneğin bir davul parçasını mırıldanmak veya 20 saniyelik bir klibi daha uzun bir şeye uzatmak yararlı olabilir.

Şimdi kötü haber. Bu hala yapay zekanın ürettiği müzik. Bir sohbet parçası ve olası bir geleceğin sembolü olarak harika; tamirciler için harika, müzisyenler içinse kötü, ama hepsi bu. Katmanlar ortaya çıkmaya başlayana kadar şarkılar ilk başta zarif görünebilir. Sonra işler biraz korkutucu olmaya başlıyor.

Örneğin, sistem ses eklemeyi seviyor ancak bilinen herhangi bir insan dilinde değil. Yapay zekanın yarattığı görsellerde metnin hangi dilde oluştuğunu düşünüyorum. Vokaller gerçek insanlar gibi ses çıkarıyor ve diğer zamanlarda uzayda süzülen Gregoryen ozanlar gibi ses çıkarıyor. Bu tekinsiz vadinin ortasında muhteşem bir yer. kenar Balina sesleriyle karşılaştırıldığında “ruhsuz ve uzaylı”. Bu takip ediyor.

Steady Audio 2.0, çıkış türünden bağımsız olarak tüm bu sistemlerin yaptığı aynı tuhaf küçük hataları yapıyor. Parçalar kaybolup yerini başka bir şeye bırakabilir. Bazen melodik unsurlar da Aniden ikiye katlayınYapay zeka tarafından oluşturulan fotoğraflardaki ekstra parmakların sesli versiyonu gibi.

Bir de bunların can sıkıntısı var. Bu, insanlarla hiçbir bağlantısı olmayan, sadece ismen müzik, ne anlamı var? Başka bir kişinin veya bir grubun aklına girmek için müzik dinlerim. Yapay genel zekanın (AGI) sürekli ifade edilmesine rağmen buraya girecek bir kafa yok. Sadece aylar kaldı.

Yani bu teknoloji, saçma sapan Noel videoları ya da banka müziği yapanlar için mutlak bir nimet. Herkes için? Omuz silkiyorum. Kişisel deneyimlerime dayanarak söyleyebileceğim tek şey: Çok hızlı. İcat edilen sistem kesinlikle dehşet verici Kedim hakkında büyük grup şarkısı Yaklaşık bir dakika içinde.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir