Başta ChatGPT ve Midjourney olmak üzere son yılların en büyük teknolojik atılımlarının başında üretken yapay zekâ geliyor. Bu yapay zekâlardan biri de Max Planck Enstitüsü tarafından geliştirilen DragGAN. Geçen yıl çıkan bu yapay zekâ, tam olarak “Ay bu fotoğrafta biraz daha yan dursaydım keşke.” ya da “Tam da fotoğraf çekilirken perde uçuşup yüzümü kapatmış.” diyenleri sevindirecek tipten. Çünkü DragGAN (sürükleme ve üretken sözcüklerinden oluşturulmuş isimden de anlaşılabileceği üzere) görsellerde bir şeyleri sürükleyip değiştirmeye yarıyor.
DragGAN aslında birinci çıktığından bu yana fiyatsız lakin kullanması biraz zahmetli bir yapay zekâ aracı. Bunun birinci nedeni de ağır ilgiden kaynaklı olarak sık sık çökmesi. Tekrar de sistemde oluşturulabilen pek çok harika görüntüyü görmek bile bu çökmelerle uğraşmaya değiyor.
DragGAN nasıl kullanılır?
DragGAN’ı kullanmak için öncelikle burada bulunan GitHub sayfasına gitmek gerekiyor. Bu sayfada geliştirici XingangPan tarafından yayımlanmış olan kodlar yer alıyor.
Bununla uğraşmak istemiyorsanız da burada yer alan Google Collab sayfasından modele erişmeniz mümkün oluyor.
İşte DragGAN ile oluşturulmuş kimi örnekler:
Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold
paper page: https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA
— AK (@_akhaliq) May 19, 2023