Yapay zekâ teknolojilerinin gelişimiyle kendimizin yahut bir diğerinin sesini klonlayabilir, bu sesle cümleler söyletebilir olmuştuk. ElevenLabs ve Uberduck üzere platformlar bu bahiste tepede bulunurken bugün Meta’dan sürpriz bir atılım geldi.
Meta, yapay zekâ ile konuşmalar üretmenizi sağlayan yeni “Voicebox” yapay zekâsını duyurdu. Voicebox, tıpkı az evvel bahsettiklerimiz üzere sesinizi klonlamanızı, bu ses ile yazdığınız metni seslendirmenizi sağlıyor. Elbette asıl olay, metnin seslendirilmesinin tıpkı bir insan gibi yapılmasında yatıyor.
Karşınızda Meta’nın ses teknolojisi Voicebox:
- Voicebox ile konuşma usulü klonlama.
Meta’nın “konuşmada üretken yapay zekâlar için çığır açan buluş” olarak paylaştığı Voicebox, yalnızca ses taklit etme ve yazılanı okumak üzere işlevlere sahip olmayacak. Yapay zekâ, bundan farklı lisanlarda konuşmanızı sağlamak dahil çok daha fazlasını yapacak:
Voicebox, sizin sesinizi alarak, İngilizce, Fransızca, Almanca, İspanyolca, Polonyaca yahut Portekizce olarak bir içeriği seslendirebilecek.
Üstelik farklı lisanlarda seslendirme için o lisanda yazı yahut ses sunmanız gerekmeyecek. Yapay zekâ, Fransızca bir sesi yahut metni İngilizce yahut başka tüm desteklenen lisanlara çevirebilecek.
Sadece 2 saniyede ses klonlanabilecek:
Günümüz ses klonlama platformları, klonlama süreci için en az 5 dakikalık kayıtlar isterken Meta burada nitekim çığır açmayı başardı. Şirket, Voicebox’ın sadece 2 saniyelik bir kayıtla ses tarzını öğrenebildiğini ve bu tarzı seslendirmeye aktarabildiğini tabir etti.
- Ses düzenleme çalışması.
Tüm bunların yanı sıra ses kaydı alırken fark etmeden yanlış söylem ettiğiniz sözler, Voicebox ile yapay zekâ aracılığıyla sonradan düzenlenebilecek.
Şirket, Voicebox hakkındaki araştırma makalesini yayınladı. Ayrıyeten kullanıcıların yapay zekânın birinci seslerini duyabilecekleri demo sayfasını da yayınladı. Lakin yapay zekâ, kötüye kullanım ihtimalleri nedeniyle şimdi kullanıma sunulmadı. Şimdilik sırf bilimsel çalışmalara açık olacak.