Üretken yapay zekâ modelleri, artık yalnızca fotoğraf değil, gerçeğinden ayırt edilemeyen videolar da oluşturabiliyor. Bunun en yeterli örneği, OpenAI tarafından geçtiğimiz aylarda tanıtılan “Sora”. Şimdi geniş çapta kullanıma sunulmayan bu model, metinlerden çok kısa müddette ultra gerçekçi görüntüler oluşturabiliyordu.
Şimdi ise OpenAI’ın Sora’sına önemli rakip olabilecek bir model tanıtıldı. “Vidu” ismini alan bu yapay zekâ aracı, Çin’den geldi.
Tek bir tıkla 16 saniyelik 1080p çözünürlükte görüntüler oluşturabiliyor!
🚨 China just released SORA’s rival “Vidu”
This is China's first long duration, high consistency, and high dynamics video modelIt can create videos upto 16s with 1080P in single click.
It excels at simulating the real physical world and also showcases a vivid imagination,… pic.twitter.com/6ThjAxrQs2
— Sambhav Gupta (@sambhavgupta6) April 27, 2024
*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.
Çin’in birinci metinden görsel oluşturma modeli olarak nitelendirilen Vidu, bugün Pekin’de düzenlenen teknoloji aktifliği Zhongguancun Forum kapsamında tanıtıldı. Modelden paylaşılan örnekler, üretken yapay zekâ yarışının yalnızca ABD’de değil, tüm dünyada kızışacağını ortaya koydu.
Vidu, Çinli yapay zekâ firması Shengshu Technology ile Tsinghua Üniversitesi iş birliğinde geliştirildi. Yapılan açıklamada, modelin metin komutları yoluyla 16 saniye uzunluğunda 1080p çözünürlükte görüntüler oluşturabildiği aktarıldı.
Şirketin China Daily’ye yaptığı açıklamaya nazaran Vidu, hem daha uzun müddetlerde görüntüler oluşturabiliyor hem de yüksek düzeyde tutarlılık sunuyor. Ayrıyeten Sora düzeyine çok yakın olduğu da sav ediliyor. Paylaşılan örneklere baktığımızda, nitekim de bunu görebiliyoruz. Gerçek çekimler üzere gözüken görüntüleri en az Sora kadar başarılı bir formda oluşturabiliyor.
Shengshu Technology, modelin temel mimarisinin Eylül 2022’den beri geliştirildiğini tabir etti. Bu da Sora’dan daha uzun müddettir üzerinde çalışıldığı manasına geliyor. Ayrıyeten rakibinin bilakis Çin kültürüne has panda ve ejderha üzere ögeleri anlayabildiği de gelen bilgiler ortasında. Modelin ne vakit kullanıcılara sunulacağı konusunda ise şimdi bir bilgi yok.