Yeni bir AI sistemi, doğal dil açıklamalarından hem gerçekçi hem de gerçeküstü çeşitli görüntüler oluşturabilir. Oyunu değiştirme potansiyeli var, ancak bazı endişeler de yok.
Algoritmalar ve yapay zeka, sanat endüstrisinde dalgalar yaratmaya devam ediyor.
En son atılım, DALL-E programının yeni bir versiyonunu açıklayan OpenAI adlı bir araştırma ekibinden geliyor. Bu yazılım, kullanıcı tarafından girilen bir açıklamaya dayalı olarak resim üreten bir metinden görüntüye oluşturma aracıdır.
Bu gönderiyi Instagram'da görüntüle
Uygun bir şekilde DALL-E 2 olarak adlandırılan bu yeni AI, halka açık olmayacak, ancak araştırmacılar, yeteneklerini önizlemek için kaydolabilir. OpenAI, yazılımını eninde sonunda üçüncü taraf uygulamalarda kullanıma sunmayı planladığını söylüyor - bunun ne zaman olacağına dair bir bilgi yok.
Şimdilik program, onaylanmış ortaklar tarafından test edilecektir.
Kullanıcıların 'zarar verebilecek' oluşturulmuş görüntüleri yüklemelerine izin verilmez ve AI'yı ne için kullandıklarını açıklamaları gerekir.
DALL-E 2 nasıl çalışır?
Hiçbir şekilde bir kodlama uzmanı olmasam da, yapabilmek DALL-E 2'nin önceden oluşturulmuş bir görüntü kitaplığı kullanarak çalıştığını onaylayın. Algoritmaya çok sayıda etiketli resim verilir ve daha sonra zaten bildiklerine dayalı olarak yeni sanat eserleri oluşturur.
Kano üzerinde bir kaplan görüntüsü oluşturmak istediğinizi varsayalım. Garip, değil mi? Ancak DALL-E 2, hem "kano" hem de "kaplan"ın nasıl göründüğünü bulmak için dosyalarını araştıracak ve her ikisini de inandırıcı bir şekilde birleştiren tek bir parça oluşturacaktır.
Bu gönderiyi Instagram'da görüntüle
DALL-E 2, bir bilgisayar görüş sistemi olan ilk yinelemenin CLIP'i üzerine kuruludur. OpenAI, bu yeni yazılımın, bir parçanın birkaç nokta olarak başladığı ve yavaş yavaş ayrıntılarla doldurulduğu 'difüzyon' kullanarak görüntüler oluşturduğunu söylüyor.
Bu süreç iki aşamalı bir model aracılığıyla gerçekleşir. CLIP önce metninizi diğer mevcut fotoğraf ve resimlerle eşleştirir, ardından bir 'kod çözücü' resmin kendisini oluşturur.
Yukarıdaki video, AI tarafından oluşturulan kedileri, önceden var olan görüntülerin gerçekçi olarak düzenlenmiş versiyonlarını ve DALL-E 2'nin komutlarınızı anlamasını sağlayan karmaşık bir nesne etiketleme sistemini göstererek, neyin mümkün olduğuna dair kısa bir gösteri sunar. Gerçekten etkileyici bir şey.
İlginç bir şekilde, OpenAI hala düzeltilmesi gereken hatalar ve sorunlar olduğunu vurguluyor.
Bu gönderiyi Instagram'da görüntüle
Yanlış etiketlenmiş nesneler, algoritmanın sağlanan metin açıklamasıyla uyuşmayan yanlış resimler üretmesine neden olabilir. Kodlamasında, örneğin 'uçak' olarak etiketlenmiş bir arabanın önceden var olan bir fotoğrafı varsa, bu, jeneratörün rotasını tamamen bozarak Boeing yerine bir BMW'yi geri göndermesine neden olabilir.
Ek olarak, yapay zeka ilgili nesnelerin ne olduğunu etiketleyene ve öğrenene kadar çok özel istemler mümkün değildir.
Algoritma iyileştirilinceye kadar bir kasaba veya nadir bulunan hayvan türlerini istemek, bozuk, yanlış görüntülere neden olabilir. Bunun DALL-E'nin yalnızca ikinci tekrarı olduğunu unutmayın, bu nedenle gelecekte daha fazla akıl almaz demolar göreceğimizden şüpheniz olmasın.