Menu Menu

Il nuovo AI DALL-E 2 crea immagini da messaggi di testo

Un nuovo sistema di intelligenza artificiale può creare una varietà di immagini sia realistiche che surreali da descrizioni in linguaggio naturale. Ha il potenziale per cambiare il gioco, ma non senza alcune preoccupazioni.

Gli algoritmi e l'IA continuano a fare scalpore nel settore dell'arte.

L'ultima svolta arriva da un team di ricerca chiamato OpenAI, che ha appena presentato una nuova versione del suo programma DALL-E. Questo software è uno strumento di generazione da testo a immagine che produce grafica basata su una descrizione inserita dall'utente.

 

Visualizza questo post su Instagram

 

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Chiamata giustamente DALL-E 2, questa nuova IA non sarà disponibile al pubblico, ma i ricercatori possono registrarsi per vedere in anteprima le sue capacità. OpenAI afferma che prevede di rendere disponibile il suo software per l'uso in app di terze parti, anche se non si sa quando ciò accadrà.

Per ora, il programma sarà testato da partner selezionati.

Gli utenti non possono caricare immagini generate che potrebbero "causare danni" e devono rivelare per cosa stanno utilizzando l'IA.


Come funziona DALL-E 2?

Anche se non sono affatto un esperto di programmazione, io può confermare che DALL-E 2 funziona utilizzando una libreria di immagini predefinita. L'algoritmo riceve una vasta gamma di immagini contrassegnate e quindi crea nuove opere d'arte basate su ciò che già conosce.

Supponi di voler creare l'immagine di una tigre su una canoa. Strano, vero? Ma DALL-E 2 cercherà nei suoi file per trovare l'aspetto di una "canoa" e una "tigre" e creerà un unico pezzo che combini in modo convincente entrambi.

 

Visualizza questo post su Instagram

 

Un post condiviso da DALL·E da OpenAI (@openaidalle)

DALL-E 2 si basa sul CLIP della prima iterazione, un sistema di visione artificiale. OpenAI afferma che questo nuovo software genera immagini utilizzando la "diffusione", per cui un pezzo inizia con pochi punti e viene gradualmente riempito di dettagli.

Questo processo avviene attraverso un modello a due stadi. CLIP prima abbina il tuo testo ad altre fotografie e immagini esistenti, quindi un "decodificatore" genera l'immagine stessa.

Il video sopra offre una breve dimostrazione di ciò che è possibile, mostrando gatti generati dall'intelligenza artificiale, versioni modificate in modo realistico di immagini preesistenti e un complesso sistema di etichettatura degli oggetti che consente a DALL-E 2 di comprendere le tue richieste. È roba davvero impressionante.

È interessante notare che OpenAI sottolinea che ci sono ancora errori e problemi da appianare.

 

Visualizza questo post su Instagram

 

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Gli oggetti etichettati in modo errato potrebbero far sì che l'algoritmo produca immagini errate che non si allineano con la descrizione del testo fornita. Se all'interno della sua codifica ha una foto preesistente di un'auto etichettata come "aereo", ad esempio, questo potrebbe portare il generatore completamente fuori rotta, rimandando indietro una BMW invece di un Boeing.

Inoltre, non sono possibili richieste molto specifiche fino a quando l'IA non ha etichettato e appreso quali sono gli oggetti rilevanti.

La richiesta di una città o di una specie animale rara può risultare in immagini traballanti e errate fino a quando l'algoritmo non è stato migliorato. Tieni presente che questa è solo la seconda iterazione di DALL-E, quindi senza dubbio vedremo demo ancora più strabilianti in futuro.


Perché questo potrebbe causare problemi agli artisti?

Dopo aver esaminato l'artwork creato da DALL-E 2, è difficile non sentirsi entusiasti delle possibilità della tecnologia.

Tuttavia, dovremmo essere consapevoli delle potenziali insidie. Gli artisti hanno già difficoltà a guadagnare soldi per il loro lavoro nell'era di Internet - da qui il motivo iniziale degli NFT - e un nuovo strumento di immagine basato su algoritmi potrebbe far fallire molti piccoli illustratori digitali.

 

Visualizza questo post su Instagram

 

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Diventerà anche molto più difficile verificare l'autenticità di un'immagine o di un dipinto online e potrebbe svalutare il lavoro di veri esseri umani. Il mining istantaneo di immagini potrebbe diventare una possibilità, creando un mercato NFT ancora più sfruttatore.

Se tutti possono realizzare qualcosa all'istante, illustrazioni e dipinti perdono tutto il loro valore commerciale? L'arte stessa diventa semplicemente un'altra applicazione o strumento utilizzabile da chiunque?

 

Visualizza questo post su Instagram

 

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Ci sono grandi domande esistenziali sulle implicazioni di un software così innovativo, molte delle quali non abbiamo le risposte.

A merito di OpenAI, a quanto pare molto consapevole dei pericoli. Dice che DALL-E 2 non sarà mai completamente disponibile al pubblico e verrà distribuito solo lentamente a ricercatori e partner fidati sulla base del feedback. Gli utenti dovranno dire perché stanno utilizzando il software e non possono creare immagini oscene o dannose.

Vuole garantire che la disinformazione o le immagini false non finiscano per causare ulteriore scompiglio ai nostri sistemi politici e anche al discorso online.

 

Visualizza questo post su Instagram

 

Un post condiviso da DALL·E da OpenAI (@openaidalle)

Queste intenzioni possono essere abbastanza solide, ma chi può dire che altri programmatori meno ben intenzionati non si limiteranno a copiare il lavoro di OpenAI? Abbiamo già visto il lancio di un'applicazione chiamata Wombo's Dream l'anno scorso, chiaramente basata su questo concetto.

Puoi accedervi proprio adesso – anche se è molto meno sofisticato di DALL-E 2.

In definitiva, non abbiamo idea di come questa tecnologia possa avere un impatto sul mondo dell'arte. Cosa abbiamo do so è che le cose stanno diventando spaventosamente impressionanti, forse anche una piccola valle misteriosa. Per ora, OpenAI sembra lanciare i suoi prodotti in modo responsabile, ed è il meglio che possiamo sperare in questa fase iniziale.

Accessibilità