Yeni AI DALL-E 2, metin istemlerinden görüntüler oluşturur

Kültür
Dizayn
14 Nisan 2022'de yayınlandı

Kredi bilgileri: OpenAI

By Charlie Coombs

London, UK

2 enerji - Enerjiyi Kaldır

0 yorumlar

Yeni bir AI sistemi, doğal dil açıklamalarından hem gerçekçi hem de gerçeküstü çeşitli görüntüler oluşturabilir. Oyunu değiştirme potansiyeli var, ancak bazı endişeler de yok.

Algoritmalar ve yapay zeka, sanat endüstrisinde dalgalar yaratmaya devam ediyor.

En son atılım, DALL-E programının yeni bir versiyonunu açıklayan OpenAI adlı bir araştırma ekibinden geliyor. Bu yazılım, kullanıcı tarafından girilen bir açıklamaya dayalı olarak resim üreten bir metinden görüntüye oluşturma aracıdır.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Uygun bir şekilde DALL-E 2 olarak adlandırılan bu yeni AI, halka açık olmayacak, ancak araştırmacılar, yeteneklerini önizlemek için kaydolabilir. OpenAI, yazılımını eninde sonunda üçüncü taraf uygulamalarda kullanıma sunmayı planladığını söylüyor - bunun ne zaman olacağına dair bir bilgi yok.

Şimdilik program, onaylanmış ortaklar tarafından test edilecektir.

Kullanıcıların 'zarar verebilecek' oluşturulmuş görüntüleri yüklemelerine izin verilmez ve AI'yı ne için kullandıklarını açıklamaları gerekir.

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

DALL-E 2 nasıl çalışır?

Hiçbir şekilde bir kodlama uzmanı olmasam da, yapabilmek DALL-E 2'nin önceden oluşturulmuş bir görüntü kitaplığı kullanarak çalıştığını onaylayın. Algoritmaya çok sayıda etiketli resim verilir ve daha sonra zaten bildiklerine dayalı olarak yeni sanat eserleri oluşturur.

Kano üzerinde bir kaplan görüntüsü oluşturmak istediğinizi varsayalım. Garip, değil mi? Ancak DALL-E 2, hem "kano" hem de "kaplan"ın nasıl göründüğünü bulmak için dosyalarını araştıracak ve her ikisini de inandırıcı bir şekilde birleştiren tek bir parça oluşturacaktır.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

DALL-E 2, bir bilgisayar görüş sistemi olan ilk yinelemenin CLIP'i üzerine kuruludur. OpenAI, bu yeni yazılımın, bir parçanın birkaç nokta olarak başladığı ve yavaş yavaş ayrıntılarla doldurulduğu 'difüzyon' kullanarak görüntüler oluşturduğunu söylüyor.

Bu süreç iki aşamalı bir model aracılığıyla gerçekleşir. CLIP önce metninizi diğer mevcut fotoğraf ve resimlerle eşleştirir, ardından bir 'kod çözücü' resmin kendisini oluşturur.

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

Yukarıdaki video, AI tarafından oluşturulan kedileri, önceden var olan görüntülerin gerçekçi olarak düzenlenmiş versiyonlarını ve DALL-E 2'nin komutlarınızı anlamasını sağlayan karmaşık bir nesne etiketleme sistemini göstererek, neyin mümkün olduğuna dair kısa bir gösteri sunar. Gerçekten etkileyici bir şey.

İlginç bir şekilde, OpenAI hala düzeltilmesi gereken hatalar ve sorunlar olduğunu vurguluyor.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Yanlış etiketlenmiş nesneler, algoritmanın sağlanan metin açıklamasıyla uyuşmayan yanlış resimler üretmesine neden olabilir. Kodlamasında, örneğin 'uçak' olarak etiketlenmiş bir arabanın önceden var olan bir fotoğrafı varsa, bu, jeneratörün rotasını tamamen bozarak Boeing yerine bir BMW'yi geri göndermesine neden olabilir.

Ek olarak, yapay zeka ilgili nesnelerin ne olduğunu etiketleyene ve öğrenene kadar çok özel istemler mümkün değildir.

Algoritma iyileştirilinceye kadar bir kasaba veya nadir bulunan hayvan türlerini istemek, bozuk, yanlış görüntülere neden olabilir. Bunun DALL-E'nin yalnızca ikinci tekrarı olduğunu unutmayın, bu nedenle gelecekte daha fazla akıl almaz demolar göreceğimizden şüpheniz olmasın.

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

How does DALL·E 2 work? (OpenAI text-to-image model explained) (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

Bu neden sanatçılar için sorunlara neden olabilir?

DALL-E 2 tarafından yaratılan sanat eserini inceledikten sonra, teknolojinin sunduğu olanaklar karşısında heyecan duymamak elde değil.

Ancak olası tuzaklara karşı dikkatli olmalıyız. Sanatçılar, internet çağında çalışmaları için para kazanmakta zaten çok zorlanıyorlar - bu nedenle NFT'lerin ilk nedeni - ve yeni bir algoritma tabanlı görüntü aracı, birçok küçük zamanlı dijital illüstratörü işinden edebilir.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Ayrıca bir görüntünün veya resmin gerçekliğini çevrimiçi olarak doğrulamak çok daha zor hale gelecek ve gerçek insanların çalışmalarının değerini düşürebilir. Anında görüntü basımı, daha da sömürücü bir NFT pazarı yaratarak bir olasılık haline gelebilir.

Herkes anında bir şeyler yapabiliyorsa, illüstrasyonlar ve tablolar ticari değerini kaybeder mi? Sanatın kendisi, herkesin kullanabileceği başka bir uygulama veya araç haline mi geliyor?

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Gerçekten çığır açan bu tür yazılımların etkilerine ilişkin, çoğuna yanıt bulamadığımız büyük, varoluşsal sorular var.

OpenAI'nin kredisine göre, öyle görünüyor tehlikelerin çok farkında. DALL-E 2'nin asla halka tam olarak sunulmayacağını ve yalnızca geri bildirime dayalı olarak güvenilir araştırmacılara ve ortaklara yavaş yavaş dağıtılacağını söylüyor. Kullanıcıların yazılımı neden kullandıklarını söylemeleri gerekecek ve müstehcen veya zararlı herhangi bir görüntü oluşturamayacaklar.

Yanlış bilgilerin veya sahte görüntülerin siyasi sistemlerimize ve çevrimiçi söylemimize daha fazla zarar vermemesini sağlamak istiyor.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Bu niyetler yeterince sağlam olabilir, ancak diğer, daha az iyi niyetli kodlayıcıların sadece OpenAI'nin çalışmalarını kopyalamayacağını kim söyleyebilir? Açıkça bu konsepte dayanan Wombo's Dream adlı bir uygulamanın geçen yıl piyasaya sürüldüğünü zaten gördük.

ona erişebilirsin hemen – DALL-E 2'den çok daha az gelişmiş olmasına rağmen.

Sonuçta, bu teknolojinin sanat dünyasını nasıl etkileyebileceği hakkında hiçbir fikrimiz yok. ne yaptıko İşlerin korkutucu derecede etkileyici, hatta belki de biraz tekinsiz bir vadi haline geldiğini biliyorum. Şimdilik OpenAI, ürünlerini sorumlu bir şekilde piyasaya sürüyor gibi görünüyor ve bu erken aşamada umabileceğimizin en iyisi bu.

Charlie Coombs

Genel Yayın Yönetmeni London, UK

Ben Charlie (O/O), Thred'in Genel Yayın Yönetmeniyim. Birmingham Üniversitesi'nde İngilizce eğitimi aldım ve bir müzik ve oyun tutkunu olarak pop kültürüne düşkün biriyim. Beni bir Perşembe günü çalma listeleri küratörlüğü yaparken, makale başlığı resimleri tasarlarken ve elma şarabı yudumlarken bulabilirsiniz. Beni takip et Twitter, LinkedIn ve bana bazı fikirler/geri bildirimler bırakın E-posta.

Thred'den daha fazlası.

Görüş – FKA Twigs, yapay zekanın sanatçıları güçlendirebileceğini kanıtlıyor

Kredi: Wikimedia Commons

medya

Görüş – FKA Twigs, yapay zekanın sanatçıları güçlendirebileceğini kanıtlıyor

Şarkıcı, iş yükünü dengelemek için kendisinin yapay zeka versiyonunu önerdi. Yanıtlar karışık ama Twigs güçlendirici bir geleceğe işaret ediyor. FKA Twigs'in yaratıcılığı bulanıklaştırdığı biliniyor teknoloji. Sanat ve moda girişimlerinin yanı sıra ruhani müziği, filmleri ve dans rutinleri her zaman sınırları zorladı ve popüler kültür içindeki konumunu sağlamlaştırdı. Twigs, küresel düzeyde şöhrete ulaşmasına rağmen asla vazgeçmedi...

By Flo Bellinger Brighton, UK

Kredi bilgileri: Unsplash

sıradışı

Uyku turizminin yükselişini açıklamak

Hızla sağlıklı yaşam endüstrisindeki en büyük trendlerden biri haline gelen gezginlerin sayısı, yastık menüleri ve erken geceyi tercih eden aktivitelerle dolu seyahat programlarından vazgeçiyor. Bir tatil birçok şey olabilir; Bazıları için keşif, macera ve yerel mutfağı denemeyi içerir. Bazıları için bu, arkanıza yaslanıp rahatlamak, havuz kenarında bir veya iki hafta dinlenmekten başka bir şey yapmamak için bir fırsattır...

By sofya phillips London, UK

Kredi bilgileri: Thred

medya

Netflix'in açıklanmayan yapay zeka kullanımı medya manipülasyonu konusunda tartışmaya yol açtı

Netflix, yeni bir gerçek suç belgeseline açıklanmayan yapay zeka görüntülerini dahil ettiği için eleştirilerin hedefi oldu. Tepki medya manipülasyonu etrafında önemli tartışmalara yol açtı. Beğenin, korkun ya da nefret edin, yapay zeka artık günlük hayatımızın bir parçası. Yapay zeka, eğitimden eğlenceye kadar büyümeye devam edecek ve medyayla etkileşimimizin neredeyse her yönünü şekillendirecek. Ancak bu değişiklikler sınırlar gerektirir. Her iki yapay zeka da...

By Flo Bellinger Brighton, UK

'Biyonik göz' Platon'un son dinlenme yerinin gizemini çözdü

Kredi bilgileri: Thred

sıradışı

'Biyonik göz' Platon'un son dinlenme yerinin gizemini çözdü

İtalyan araştırmacı Graziano Ranocchia, sonunda Platon'un son dinlenme yerinin gizemini çözmüş olabilir. Yapay zeka destekli bir 'biyonik göz', MÖ 2,000 civarında yazılmış ve Atina'da belirli bir konumu belirleyen 348 yıllık karbonize parşömeni taradı. Dünyanın en büyük filozoflarından birinin nerede yattığı gizemi ironik bir şekilde bir makine tarafından çözülmüş olabilir. Yunan felsefesinin kurucu düşünürleri arasında tartışmasız en çok saygı duyulan Platon'un cenazesi...

By Jamie Watt London, UK

Yeni bir AI sistemi, doğal dil açıklamalarından hem gerçekçi hem de gerçeküstü çeşitli görüntüler oluşturabilir. Oyunu değiştirme potansiyeli var, ancak bazı endişeler de yok.

DALL-E 2 nasıl çalışır?

İlgili Makaleler

Uyku bizi nasıl daha mutlu edebilir?

BeReal, kendimizi çevrimiçi olarak seçmeyi bırakmamız için bizi teşvik ediyor

Bu neden sanatçılar için sorunlara neden olabilir?

Popüler

'Biyonik göz' Platon'un son dinlenme yerinin gizemini çözdü

Doğa resmen müzisyen oldu

Netflix'in açıklanmayan yapay zeka kullanımı medya manipülasyonu konusunda tartışmaya yol açtı

Gezegen-pozitif haber bültenimize kaydolarak thred'den haberdar olun!

Thred'den daha fazlası.

Görüş – FKA Twigs, yapay zekanın sanatçıları güçlendirebileceğini kanıtlıyor

Uyku turizminin yükselişini açıklamak

Netflix'in açıklanmayan yapay zeka kullanımı medya manipülasyonu konusunda tartışmaya yol açtı

'Biyonik göz' Platon'un son dinlenme yerinin gizemini çözdü