Il nuovo AI DALL-E 2 crea immagini da messaggi di testo

Cultura
Design
Inserito il 14 aprile 2022

Credito: OpenAI

By Charlie Combs

Londra, Regno Unito

2 energia - Rimuovi energia

0 commenti

Un nuovo sistema di intelligenza artificiale può creare una varietà di immagini sia realistiche che surreali da descrizioni in linguaggio naturale. Ha il potenziale per cambiare il gioco, ma non senza alcune preoccupazioni.

Gli algoritmi e l'IA continuano a fare scalpore nel settore dell'arte.

L'ultima svolta arriva da un team di ricerca chiamato OpenAI, che ha appena presentato una nuova versione del suo programma DALL-E. Questo software è uno strumento di generazione da testo a immagine che produce grafica basata su una descrizione inserita dall'utente.

Visualizza questo post su Instagram

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Chiamata giustamente DALL-E 2, questa nuova IA non sarà disponibile al pubblico, ma i ricercatori possono registrarsi per vedere in anteprima le sue capacità. OpenAI afferma che prevede di rendere disponibile il suo software per l'uso in app di terze parti, anche se non si sa quando ciò accadrà.

Per ora, il programma sarà testato da partner selezionati.

Gli utenti non possono caricare immagini generate che potrebbero "causare danni" e devono rivelare per cosa stanno utilizzando l'IA.

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

Come funziona DALL-E 2?

Anche se non sono affatto un esperto di programmazione, io può confermare che DALL-E 2 funziona utilizzando una libreria di immagini predefinita. L'algoritmo riceve una vasta gamma di immagini contrassegnate e quindi crea nuove opere d'arte basate su ciò che già conosce.

Supponi di voler creare l'immagine di una tigre su una canoa. Strano, vero? Ma DALL-E 2 cercherà nei suoi file per trovare l'aspetto di una "canoa" e una "tigre" e creerà un unico pezzo che combini in modo convincente entrambi.

Visualizza questo post su Instagram

Un post condiviso da DALL·E da OpenAI (@openaidalle)

DALL-E 2 si basa sul CLIP della prima iterazione, un sistema di visione artificiale. OpenAI afferma che questo nuovo software genera immagini utilizzando la "diffusione", per cui un pezzo inizia con pochi punti e viene gradualmente riempito di dettagli.

Questo processo avviene attraverso un modello a due stadi. CLIP prima abbina il tuo testo ad altre fotografie e immagini esistenti, quindi un "decodificatore" genera l'immagine stessa.

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

Il video sopra offre una breve dimostrazione di ciò che è possibile, mostrando gatti generati dall'intelligenza artificiale, versioni modificate in modo realistico di immagini preesistenti e un complesso sistema di etichettatura degli oggetti che consente a DALL-E 2 di comprendere le tue richieste. È roba davvero impressionante.

È interessante notare che OpenAI sottolinea che ci sono ancora errori e problemi da appianare.

Visualizza questo post su Instagram

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Gli oggetti etichettati in modo errato potrebbero far sì che l'algoritmo produca immagini errate che non si allineano con la descrizione del testo fornita. Se all'interno della sua codifica ha una foto preesistente di un'auto etichettata come "aereo", ad esempio, questo potrebbe portare il generatore completamente fuori rotta, rimandando indietro una BMW invece di un Boeing.

Inoltre, non sono possibili richieste molto specifiche fino a quando l'IA non ha etichettato e appreso quali sono gli oggetti rilevanti.

La richiesta di una città o di una specie animale rara può risultare in immagini traballanti e errate fino a quando l'algoritmo non è stato migliorato. Tieni presente che questa è solo la seconda iterazione di DALL-E, quindi senza dubbio vedremo demo ancora più strabilianti in futuro.

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

OpenAI's new model DALL·E 2 is amazing! (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

Perché questo potrebbe causare problemi agli artisti?

Dopo aver esaminato l'artwork creato da DALL-E 2, è difficile non sentirsi entusiasti delle possibilità della tecnologia.

Tuttavia, dovremmo essere consapevoli delle potenziali insidie. Gli artisti hanno già difficoltà a guadagnare soldi per il loro lavoro nell'era di Internet - da qui il motivo iniziale degli NFT - e un nuovo strumento di immagine basato su algoritmi potrebbe far fallire molti piccoli illustratori digitali.

Visualizza questo post su Instagram

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Diventerà anche molto più difficile verificare l'autenticità di un'immagine o di un dipinto online e potrebbe svalutare il lavoro di veri esseri umani. Il mining istantaneo di immagini potrebbe diventare una possibilità, creando un mercato NFT ancora più sfruttatore.

Se tutti possono realizzare qualcosa all'istante, illustrazioni e dipinti perdono tutto il loro valore commerciale? L'arte stessa diventa semplicemente un'altra applicazione o strumento utilizzabile da chiunque?

Visualizza questo post su Instagram

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Ci sono grandi domande esistenziali sulle implicazioni di un software così innovativo, molte delle quali non abbiamo le risposte.

A merito di OpenAI, a quanto pare molto consapevole dei pericoli. Dice che DALL-E 2 non sarà mai completamente disponibile al pubblico e verrà distribuito solo lentamente a ricercatori e partner fidati sulla base del feedback. Gli utenti dovranno dire perché stanno utilizzando il software e non possono creare immagini oscene o dannose.

Vuole garantire che la disinformazione o le immagini false non finiscano per causare ulteriore scompiglio ai nostri sistemi politici e anche al discorso online.

Visualizza questo post su Instagram

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Queste intenzioni possono essere abbastanza solide, ma chi può dire che altri programmatori meno ben intenzionati non si limiteranno a copiare il lavoro di OpenAI? Abbiamo già visto il lancio di un'applicazione chiamata Wombo's Dream l'anno scorso, chiaramente basata su questo concetto.

Puoi accedervi proprio adesso – anche se è molto meno sofisticato di DALL-E 2.

In definitiva, non abbiamo idea di come questa tecnologia possa avere un impatto sul mondo dell'arte. Cosa abbiamo do so è che le cose stanno diventando spaventosamente impressionanti, forse anche una piccola valle misteriosa. Per ora, OpenAI sembra lanciare i suoi prodotti in modo responsabile, ed è il meglio che possiamo sperare in questa fase iniziale.

Charlie Combs

Redattore capo Londra, Regno Unito

Sono Charlie (lui/lui), il caporedattore di Thred. Ho studiato inglese all'Università di Birmingham e, da appassionato di musica e giochi, sono un secchione della cultura pop. Puoi trovarmi a curare playlist, progettare immagini di titoli di articoli e sorseggiare sidro il giovedì. Seguimi su Twitter, LinkedIn e mandami qualche idea/feedback tramite email.

Altro da tre.

L'"occhio bionico" risolve il mistero dell'ultima dimora di Platone

Credito: Thred

anticonformista

L'"occhio bionico" risolve il mistero dell'ultima dimora di Platone

Il ricercatore italiano Graziano Ranocchia potrebbe aver finalmente risolto il mistero dell'ultima dimora di Platone. Un “occhio bionico” alimentato dall’intelligenza artificiale ha scansionato un rotolo carbonizzato di 2,000 anni scritto intorno al 348 a.C. che individuava una posizione specifica ad Atene. Il mistero di dove riposa uno dei più grandi filosofi del mondo potrebbe essere stato appena risolto – da una macchina, ironicamente. La sepoltura di Platone, probabilmente il più venerato tra i pensatori fondatori della filosofia greca...

By Jamie Watt Londra, Regno Unito

La natura è ufficialmente diventata musicista

Credito: Pexels

Media

La natura è ufficialmente diventata musicista

Nell'ambito di una nuova campagna, la natura è stata riconosciuta come artista sulle principali piattaforme di streaming, tra cui Spotify. Le royalties andranno a sostenere iniziative di azione per il clima in tutto il mondo. Le temperature stanno aumentando, gli habitat si stanno riducendo e i ghiacciai si stanno sciogliendo a un ritmo senza precedenti. Mentre il clima cambia, la sofferenza della Terra continua a raggiungere nuove vette, e la realtà che il tempo per fare qualcosa sta per scadere diventa...

By Sofia Phillips Londra, Regno Unito

Cosa sono gli “anni sabbatici degli adulti” e perché sono in aumento?

Credito: Unsplash

anticonformista

Cosa sono gli “anni sabbatici degli adulti” e perché sono in aumento?

Solitamente un rito di passaggio pre-universitario per adolescenti e persone sui vent'anni, mettere tutto da parte per viaggiare per il mondo sta rapidamente diventando una tendenza tra le generazioni più anziane che cercano una pausa dalla natura implacabile della vita da adulti. Tipicamente associato alla soglia dell'età adulta, un anno sabbatico è un periodo di sviluppo per coloro che hanno tempo e risorse per viaggiare, fare volontariato,...

By Sofia Phillips Londra, Regno Unito

Cos'è la "teoria di Internet morto" ed è reale?

Credito: Thred

anticonformista

Cos'è la "teoria di Internet morto" ed è reale?

Con la crescita incessante dell’intelligenza artificiale a partire dal 2022, le cospirazioni che circondano la cosiddetta “teoria di Internet morto” si sono rafforzate. Ma per prima cosa, che diavolo è e ha qualche credibilità? Vale la pena perdersi in questa tana del coniglio online? È pura tempesta in una tazza da tè? È stato un essere umano a scrivere questo articolo? Così tante domande. Se trascorri una quantità significativa di tempo su Twitter (X)...

By Jamie Watt Londra, Regno Unito