Menü Menü

Yeni AI DALL-E 2, metin istemlerinden görüntüler oluşturur

Yeni bir AI sistemi, doğal dil açıklamalarından hem gerçekçi hem de gerçeküstü çeşitli görüntüler oluşturabilir. Oyunu değiştirme potansiyeli var, ancak bazı endişeler de yok.

Algoritmalar ve yapay zeka, sanat endüstrisinde dalgalar yaratmaya devam ediyor.

En son atılım, DALL-E programının yeni bir versiyonunu açıklayan OpenAI adlı bir araştırma ekibinden geliyor. Bu yazılım, kullanıcı tarafından girilen bir açıklamaya dayalı olarak resim üreten bir metinden görüntüye oluşturma aracıdır.

Uygun bir şekilde DALL-E 2 olarak adlandırılan bu yeni AI, halka açık olmayacak, ancak araştırmacılar, yeteneklerini önizlemek için kaydolabilir. OpenAI, yazılımını eninde sonunda üçüncü taraf uygulamalarda kullanıma sunmayı planladığını söylüyor - bunun ne zaman olacağına dair bir bilgi yok.

Şimdilik program, onaylanmış ortaklar tarafından test edilecektir.

Kullanıcıların 'zarar verebilecek' oluşturulmuş görüntüleri yüklemelerine izin verilmez ve AI'yı ne için kullandıklarını açıklamaları gerekir.


DALL-E 2 nasıl çalışır?

Hiçbir şekilde bir kodlama uzmanı olmasam da, yapabilmek DALL-E 2'nin önceden oluşturulmuş bir görüntü kitaplığı kullanarak çalıştığını onaylayın. Algoritmaya çok sayıda etiketli resim verilir ve daha sonra zaten bildiklerine dayalı olarak yeni sanat eserleri oluşturur.

Kano üzerinde bir kaplan görüntüsü oluşturmak istediğinizi varsayalım. Garip, değil mi? Ancak DALL-E 2, hem "kano" hem de "kaplan"ın nasıl göründüğünü bulmak için dosyalarını araştıracak ve her ikisini de inandırıcı bir şekilde birleştiren tek bir parça oluşturacaktır.

DALL-E 2, bir bilgisayar görüş sistemi olan ilk yinelemenin CLIP'i üzerine kuruludur. OpenAI, bu yeni yazılımın, bir parçanın birkaç nokta olarak başladığı ve yavaş yavaş ayrıntılarla doldurulduğu 'difüzyon' kullanarak görüntüler oluşturduğunu söylüyor.

Bu süreç iki aşamalı bir model aracılığıyla gerçekleşir. CLIP önce metninizi diğer mevcut fotoğraf ve resimlerle eşleştirir, ardından bir 'kod çözücü' resmin kendisini oluşturur.

Yukarıdaki video, AI tarafından oluşturulan kedileri, önceden var olan görüntülerin gerçekçi olarak düzenlenmiş versiyonlarını ve DALL-E 2'nin komutlarınızı anlamasını sağlayan karmaşık bir nesne etiketleme sistemini göstererek, neyin mümkün olduğuna dair kısa bir gösteri sunar. Gerçekten etkileyici bir şey.

İlginç bir şekilde, OpenAI hala düzeltilmesi gereken hatalar ve sorunlar olduğunu vurguluyor.

Yanlış etiketlenmiş nesneler, algoritmanın sağlanan metin açıklamasıyla uyuşmayan yanlış resimler üretmesine neden olabilir. Kodlamasında, örneğin 'uçak' olarak etiketlenmiş bir arabanın önceden var olan bir fotoğrafı varsa, bu, jeneratörün rotasını tamamen bozarak Boeing yerine bir BMW'yi geri göndermesine neden olabilir.

Ek olarak, yapay zeka ilgili nesnelerin ne olduğunu etiketleyene ve öğrenene kadar çok özel istemler mümkün değildir.

Algoritma iyileştirilinceye kadar bir kasaba veya nadir bulunan hayvan türlerini istemek, bozuk, yanlış görüntülere neden olabilir. Bunun DALL-E'nin yalnızca ikinci tekrarı olduğunu unutmayın, bu nedenle gelecekte daha fazla akıl almaz demolar göreceğimizden şüpheniz olmasın.


Bu neden sanatçılar için sorunlara neden olabilir?

DALL-E 2 tarafından yaratılan sanat eserini inceledikten sonra, teknolojinin sunduğu olanaklar karşısında heyecan duymamak elde değil.

Ancak olası tuzaklara karşı dikkatli olmalıyız. Sanatçılar, internet çağında çalışmaları için para kazanmakta zaten çok zorlanıyorlar - bu nedenle NFT'lerin ilk nedeni - ve yeni bir algoritma tabanlı görüntü aracı, birçok küçük zamanlı dijital illüstratörü işinden edebilir.

Ayrıca bir görüntünün veya resmin gerçekliğini çevrimiçi olarak doğrulamak çok daha zor hale gelecek ve gerçek insanların çalışmalarının değerini düşürebilir. Anında görüntü basımı, daha da sömürücü bir NFT pazarı yaratarak bir olasılık haline gelebilir.

Herkes anında bir şeyler yapabiliyorsa, illüstrasyonlar ve tablolar ticari değerini kaybeder mi? Sanatın kendisi, herkesin kullanabileceği başka bir uygulama veya araç haline mi geliyor?

Gerçekten çığır açan bu tür yazılımların etkilerine ilişkin, çoğuna yanıt bulamadığımız büyük, varoluşsal sorular var.

OpenAI'nin kredisine göre, öyle görünüyor tehlikelerin çok farkında. DALL-E 2'nin asla halka tam olarak sunulmayacağını ve yalnızca geri bildirime dayalı olarak güvenilir araştırmacılara ve ortaklara yavaş yavaş dağıtılacağını söylüyor. Kullanıcıların yazılımı neden kullandıklarını söylemeleri gerekecek ve müstehcen veya zararlı herhangi bir görüntü oluşturamayacaklar.

Yanlış bilgilerin veya sahte görüntülerin siyasi sistemlerimize ve çevrimiçi söylemimize daha fazla zarar vermemesini sağlamak istiyor.

Bu niyetler yeterince sağlam olabilir, ancak diğer, daha az iyi niyetli kodlayıcıların sadece OpenAI'nin çalışmalarını kopyalamayacağını kim söyleyebilir? Açıkça bu konsepte dayanan Wombo's Dream adlı bir uygulamanın geçen yıl piyasaya sürüldüğünü zaten gördük.

ona erişebilirsin hemen – DALL-E 2'den çok daha az gelişmiş olmasına rağmen.

Sonuçta, bu teknolojinin sanat dünyasını nasıl etkileyebileceği hakkında hiçbir fikrimiz yok. ne yaptıko İşlerin korkutucu derecede etkileyici, hatta belki de biraz tekinsiz bir vadi haline geldiğini biliyorum. Şimdilik OpenAI, ürünlerini sorumlu bir şekilde piyasaya sürüyor gibi görünüyor ve bu erken aşamada umabileceğimizin en iyisi bu.

Engellilerin kullanımları için uygunluk