Yeni AI DALL-E 2, metin istemlerinden görüntüler oluşturur

Kültür
Dizayn
14 Nisan 2022'de yayınlandı

Kredi bilgileri: OpenAI

By Charlie Coombs

London, UK

2 enerji - Enerjiyi Kaldır

0 yorumlar

Yeni bir AI sistemi, doğal dil açıklamalarından hem gerçekçi hem de gerçeküstü çeşitli görüntüler oluşturabilir. Oyunu değiştirme potansiyeli var, ancak bazı endişeler de yok.

Algoritmalar ve yapay zeka, sanat endüstrisinde dalgalar yaratmaya devam ediyor.

En son atılım, DALL-E programının yeni bir versiyonunu açıklayan OpenAI adlı bir araştırma ekibinden geliyor. Bu yazılım, kullanıcı tarafından girilen bir açıklamaya dayalı olarak resim üreten bir metinden görüntüye oluşturma aracıdır.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Uygun bir şekilde DALL-E 2 olarak adlandırılan bu yeni AI, halka açık olmayacak, ancak araştırmacılar, yeteneklerini önizlemek için kaydolabilir. OpenAI, yazılımını eninde sonunda üçüncü taraf uygulamalarda kullanıma sunmayı planladığını söylüyor - bunun ne zaman olacağına dair bir bilgi yok.

Şimdilik program, onaylanmış ortaklar tarafından test edilecektir.

Kullanıcıların 'zarar verebilecek' oluşturulmuş görüntüleri yüklemelerine izin verilmez ve AI'yı ne için kullandıklarını açıklamaları gerekir.

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

DALL-E 2 nasıl çalışır?

Hiçbir şekilde bir kodlama uzmanı olmasam da, yapabilmek DALL-E 2'nin önceden oluşturulmuş bir görüntü kitaplığı kullanarak çalıştığını onaylayın. Algoritmaya çok sayıda etiketli resim verilir ve daha sonra zaten bildiklerine dayalı olarak yeni sanat eserleri oluşturur.

Kano üzerinde bir kaplan görüntüsü oluşturmak istediğinizi varsayalım. Garip, değil mi? Ancak DALL-E 2, hem "kano" hem de "kaplan"ın nasıl göründüğünü bulmak için dosyalarını araştıracak ve her ikisini de inandırıcı bir şekilde birleştiren tek bir parça oluşturacaktır.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

DALL-E 2, bir bilgisayar görüş sistemi olan ilk yinelemenin CLIP'i üzerine kuruludur. OpenAI, bu yeni yazılımın, bir parçanın birkaç nokta olarak başladığı ve yavaş yavaş ayrıntılarla doldurulduğu 'difüzyon' kullanarak görüntüler oluşturduğunu söylüyor.

Bu süreç iki aşamalı bir model aracılığıyla gerçekleşir. CLIP önce metninizi diğer mevcut fotoğraf ve resimlerle eşleştirir, ardından bir 'kod çözücü' resmin kendisini oluşturur.

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

Yukarıdaki video, AI tarafından oluşturulan kedileri, önceden var olan görüntülerin gerçekçi olarak düzenlenmiş versiyonlarını ve DALL-E 2'nin komutlarınızı anlamasını sağlayan karmaşık bir nesne etiketleme sistemini göstererek, neyin mümkün olduğuna dair kısa bir gösteri sunar. Gerçekten etkileyici bir şey.

İlginç bir şekilde, OpenAI hala düzeltilmesi gereken hatalar ve sorunlar olduğunu vurguluyor.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Yanlış etiketlenmiş nesneler, algoritmanın sağlanan metin açıklamasıyla uyuşmayan yanlış resimler üretmesine neden olabilir. Kodlamasında, örneğin 'uçak' olarak etiketlenmiş bir arabanın önceden var olan bir fotoğrafı varsa, bu, jeneratörün rotasını tamamen bozarak Boeing yerine bir BMW'yi geri göndermesine neden olabilir.

Ek olarak, yapay zeka ilgili nesnelerin ne olduğunu etiketleyene ve öğrenene kadar çok özel istemler mümkün değildir.

Algoritma iyileştirilinceye kadar bir kasaba veya nadir bulunan hayvan türlerini istemek, bozuk, yanlış görüntülere neden olabilir. Bunun DALL-E'nin yalnızca ikinci tekrarı olduğunu unutmayın, bu nedenle gelecekte daha fazla akıl almaz demolar göreceğimizden şüpheniz olmasın.

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

How does DALL·E 2 work? (OpenAI text-to-image model explained) (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

Bu neden sanatçılar için sorunlara neden olabilir?

DALL-E 2 tarafından yaratılan sanat eserini inceledikten sonra, teknolojinin sunduğu olanaklar karşısında heyecan duymamak elde değil.

Ancak olası tuzaklara karşı dikkatli olmalıyız. Sanatçılar, internet çağında çalışmaları için para kazanmakta zaten çok zorlanıyorlar - bu nedenle NFT'lerin ilk nedeni - ve yeni bir algoritma tabanlı görüntü aracı, birçok küçük zamanlı dijital illüstratörü işinden edebilir.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Ayrıca bir görüntünün veya resmin gerçekliğini çevrimiçi olarak doğrulamak çok daha zor hale gelecek ve gerçek insanların çalışmalarının değerini düşürebilir. Anında görüntü basımı, daha da sömürücü bir NFT pazarı yaratarak bir olasılık haline gelebilir.

Herkes anında bir şeyler yapabiliyorsa, illüstrasyonlar ve tablolar ticari değerini kaybeder mi? Sanatın kendisi, herkesin kullanabileceği başka bir uygulama veya araç haline mi geliyor?

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Gerçekten çığır açan bu tür yazılımların etkilerine ilişkin, çoğuna yanıt bulamadığımız büyük, varoluşsal sorular var.

OpenAI'nin kredisine göre, öyle görünüyor tehlikelerin çok farkında. DALL-E 2'nin asla halka tam olarak sunulmayacağını ve yalnızca geri bildirime dayalı olarak güvenilir araştırmacılara ve ortaklara yavaş yavaş dağıtılacağını söylüyor. Kullanıcıların yazılımı neden kullandıklarını söylemeleri gerekecek ve müstehcen veya zararlı herhangi bir görüntü oluşturamayacaklar.

Yanlış bilgilerin veya sahte görüntülerin siyasi sistemlerimize ve çevrimiçi söylemimize daha fazla zarar vermemesini sağlamak istiyor.

Bu gönderiyi Instagram'da görüntüle

DALL·E tarafından OpenAI (@openaidalle) tarafından paylaşılan bir gönderi

Bu niyetler yeterince sağlam olabilir, ancak diğer, daha az iyi niyetli kodlayıcıların sadece OpenAI'nin çalışmalarını kopyalamayacağını kim söyleyebilir? Açıkça bu konsepte dayanan Wombo's Dream adlı bir uygulamanın geçen yıl piyasaya sürüldüğünü zaten gördük.

ona erişebilirsin hemen – DALL-E 2'den çok daha az gelişmiş olmasına rağmen.

Sonuçta, bu teknolojinin sanat dünyasını nasıl etkileyebileceği hakkında hiçbir fikrimiz yok. ne yaptıko İşlerin korkutucu derecede etkileyici, hatta belki de biraz tekinsiz bir vadi haline geldiğini biliyorum. Şimdilik OpenAI, ürünlerini sorumlu bir şekilde piyasaya sürüyor gibi görünüyor ve bu erken aşamada umabileceğimizin en iyisi bu.

Charlie Coombs

Genel Yayın Yönetmeni London, UK

Ben Charlie (O/O), Thred'in Genel Yayın Yönetmeniyim. Birmingham Üniversitesi'nde İngilizce eğitimi aldım ve bir müzik ve oyun tutkunu olarak pop kültürüne düşkün biriyim. Beni bir Perşembe günü çalma listeleri küratörlüğü yaparken, makale başlığı resimleri tasarlarken ve elma şarabı yudumlarken bulabilirsiniz. Beni takip et Twitter, LinkedIn ve bana bazı fikirler/geri bildirimler bırakın E-posta.

Thred'den daha fazlası.

'Biyonik göz' Platon'un son dinlenme yerinin gizemini çözdü

Kredi bilgileri: Thred

sıradışı

'Biyonik göz' Platon'un son dinlenme yerinin gizemini çözdü

İtalyan araştırmacı Graziano Ranocchia, sonunda Platon'un son dinlenme yerinin gizemini çözmüş olabilir. Yapay zeka destekli bir 'biyonik göz', MÖ 2,000 civarında yazılmış ve Atina'da belirli bir konumu belirleyen 348 yıllık karbonize parşömeni taradı. Dünyanın en büyük filozoflarından birinin nerede yattığı gizemi ironik bir şekilde bir makine tarafından çözülmüş olabilir. Yunan felsefesinin kurucu düşünürleri arasında tartışmasız en çok saygı duyulan Platon'un cenazesi...

By Jamie Watt London, UK

Kredi bilgileri: Pexels

medya

Doğa resmen müzisyen oldu

Yeni bir kampanyanın parçası olarak doğa, Spotify da dahil olmak üzere büyük yayın platformlarında bir sanatçı olarak tanındı. Telif hakları dünya çapındaki iklim eylemi girişimlerini desteklemeye gidecek. Sıcaklıklar artıyor, yaşam alanları azalıyor ve buzullar benzeri görülmemiş bir hızla eriyor. İklim değiştikçe, Dünya'nın çektiği acılar yeni boyutlara ulaşmaya devam ediyor ve bu konuda bir şeyler yapmak için zamanımızın tükendiği gerçeği...

By sofya phillips London, UK

'Ölü İnternet Teorisi' nedir ve gerçek mi?

Kredi bilgileri: Thred

sıradışı

'Ölü İnternet Teorisi' nedir ve gerçek mi?

Yapay zekanın 2022'den bu yana aralıksız büyümesiyle birlikte, 'Ölü İnternet Teorisi' olarak adlandırılan komplolar da güçlendi. Ancak ilk olarak bu nedir ve herhangi bir inandırıcılığı var mı? Burası kaybolmaya değer bir çevrimiçi tavşan deliği mi? Bir çay fincanındaki saf fırtına mı bu? Bu makaleyi bir insan mı yazdı? Çok fazla soru. Twitter'da (X) önemli miktarda zaman geçirirseniz...

By Jamie Watt London, UK

'Yetişkinler arası boşluk yılları' nedir ve neden artıyor?

Kredi bilgileri: Unsplash

sıradışı

'Yetişkinler arası boşluk yılları' nedir ve neden artıyor?

Çoğunlukla gençler ve 20'li yaşlarının başlarındaki insanlar için üniversiteye geçiş öncesi bir tören olan bu tören, dünyayı gezmek için her şeyi askıya almak, yetişkin olarak hayatın acımasız doğasından bir mola arayan yaşlı nesiller arasında hızla bir trend haline geliyor. Tipik olarak yetişkinliğin eşiğiyle ilişkilendirilen boşluk yılı, seyahat etmek, gönüllü olmak, seyahat etmek için zaman ve kaynaklara sahip olanlar için bir gelişim dönemidir...

By sofya phillips London, UK