Teknoloji Haberleri

Microsoft’un VASA-1 Yapay Zekâ Aracı Fotoğrafları “Dile Getiriyor”

Üretken yapay zekâların çıkışından çok daha evvel fotoğraflara müzikler söyletilmeye, animasyonlar yapılmaya başlanmıştı. Microsoft’un yapay zekâ aracı ise artık fotoğrafları daha gerçekçi görüntülere çeviriyor. Bununla da kalmayan araç, fotoğraflara istenilen şeyi istenilen üslupta söyletebiliyor: buna müzikler da dahil. 

Microsoft Asya Araştırma tarafından tanıtılan ve VASA-1 ismi verilen yapay zekâ aracı, rastgele bir fotoğrafı ya da çizimi alıp var olan bir ses belgesi ile birleştirebiliyor. Yeni yapay zekâ aracı yüz tabirleri ve baş hareketleri oluşturabiliyor. Ayrıyeten konuşmalara uygun ağız hareketleri de üretiyor. 

Görsellerin yapay zekâ yapıtı olduğu “şimdilik” aşikâr oluyor

Her ne kadar VASA-1’in oluşturduğu görsellerde ağız ve baş hareketleri biraz robotik gözükürken yakından baktığımızda da ses ve dudak senkronizasyonunda kaymalar oluyor. Tekrar de bu teknolojilerin vakit içerisinde düzmece manzaralar oluşturmak ya da deepfake görüntüler üretmek için kullanılabileceği de akıllara geliyor. Araştırmacılar da bu durumun farkında ve o yüzden de kullanılabilir bir demo ya da API paylaşmadılar. Bu teknolojinin de “sorumluluk sahibi şekilde” kullanılacağından emin olmak istediklerini belirtti. 

Araştırmacılar yeniden de bu teknolojinin güzel maksatlarla kullanılabileceğine inanıyor. VoxCeleb2 isimli data seti ile, 6112 ünlüye ilişkin görsellerle eğitilen yapay zekâ aracı sayesinde yapay zekâ ile irtibatın güçlenebileceği, eğitim alanında yeni araçlar geliştirilebileceği ve bağlantı zorluklarının çözülebileceği tabir ediliyor. 

Microsoft’un yayımladığı araştırmaya ve demo görsellere buradan ulaşabilirsiniz.

Haberois Editör

Türkiye'nin bir numaralı haber platformu olan Haberois, okuyucularına en güncel son dakika haberlerini tarafsız olarak sunar.

İlgili Makaleler

Başa dön tuşu