Meny Meny

Nye AI DALL-E 2 lager bilder fra tekstmeldinger

Et nytt AI-system kan lage en rekke bilder både realistiske og surrealistiske fra naturspråklige beskrivelser. Det har potensial til å endre spillet, men ikke uten noen bekymringer.

Algoritmer og kunstig intelligens fortsetter å skape bølger over hele kunstindustrien.

Det siste gjennombruddet kommer fra et forskerteam kalt OpenAI, som nettopp har avduket en ny versjon av DALL-E-programmet sitt. Denne programvaren er et tekst-til-bilde-genereringsverktøy som produserer kunstverk basert på en brukerinntastet beskrivelse.

 

Se dette innlegget på Instagram

 

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Denne nye kunstige intelligensen, passende kalt DALL-E 2, vil ikke være tilgjengelig for publikum, men forskere kan registrere seg for å forhåndsvise funksjonene. OpenAI sier at de planlegger å gjøre programvaren sin tilgjengelig for bruk i tredjepartsapper etter hvert - men ingen ord om når dette vil skje.

Foreløpig vil programmet bli testet av godkjente partnere.

Brukere har ikke lov til å laste opp genererte bilder som kan "skade", og må opplyse om hva de bruker AI til.


Hvordan fungerer DALL-E 2?

Selv om jeg på ingen måte er en kodeekspert, har jeg kan bekrefte at DALL-E 2 fungerer ved hjelp av et forhåndsbygd bildebibliotek. Algoritmen får et vell av merkede bilder og lager deretter nye kunstverk basert på det den allerede vet.

Si at du ville lage et bilde av en tiger på en kano. Rart, ikke sant? Men DALL-E 2 vil søke i filene sine for å finne hvordan en "kano" og en "tiger" begge ser ut, og skape et enkelt stykke som på overbevisende måte kombinerer begge.

 

Se dette innlegget på Instagram

 

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

DALL-E 2 bygger på den første iterasjonens CLIP, et datasynssystem. OpenAI sier at denne nye programvaren genererer bilder ved hjelp av 'diffusjon', der et stykke begynner som noen få prikker og gradvis fylles ut med detaljer.

Denne prosessen skjer via en to-trinns modell. CLIP matcher først teksten din med andre eksisterende fotografier og bilder, deretter genererer en 'dekoder' selve bildet.

Videoen ovenfor gir en kort demonstrasjon av hva som er mulig, og viser frem AI-genererte katter, realistisk redigerte versjoner av allerede eksisterende bilder og et komplekst system med objektmerking som lar DALL-E 2 forstå spørsmålene dine. Det er virkelig imponerende greier.

Interessant nok understreker OpenAI at det fortsatt er feil og problemer som må løses.

 

Se dette innlegget på Instagram

 

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Objekter som er feilmerket kan føre til at algoritmen produserer feil bilder som ikke stemmer overens med tekstbeskrivelsen. Hvis den i kodingen har et forhåndseksisterende bilde av en bil merket som et "fly", for eksempel, kan dette føre generatoren helt ut av kurs, og sende tilbake en BMW i stedet for en Boeing.

I tillegg er veldig spesifikke spørsmål ikke mulig før AI har merket og lært hva de relevante objektene er.

Å spørre etter en by eller sjeldne dyrearter kan føre til usikre, feilaktige bilder inntil algoritmen er forbedret. Husk at dette bare er den andre iterasjonen av DALL-E, så vi vil uten tvil se enda flere tankevekkende demoer i fremtiden.


Hvorfor kan dette skape problemer for artister?

Etter å ha lest kunstverket laget av DALL-E 2, er det vanskelig å ikke føle seg begeistret over mulighetene til teknologien.

Vi bør imidlertid være oppmerksomme på potensielle fallgruver. Kunstnere har allerede svært vanskelig for å tjene penger for arbeidet sitt i internettalderen – derav den første årsaken til NFT-er – og et nytt algoritmebasert bildeverktøy kan sette mange små digitale illustratører ut av drift.

 

Se dette innlegget på Instagram

 

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Det vil også bli mye vanskeligere å verifisere ektheten til et bilde eller maleri på nettet, og kan devaluere arbeidet til ekte mennesker. Instant image preging kan bli en mulighet, og skape et enda mer utnyttende NFT-marked.

Hvis alle kan lage hva som helst umiddelbart, mister illustrasjoner og malerier all sin kommersielle verdi? Blir kunst i seg selv bare en annen applikasjon eller et verktøy for alle å bruke?

 

Se dette innlegget på Instagram

 

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Det er store, eksistensielle spørsmål angående implikasjonene av en slik genuint banebrytende programvare, mange av dem har vi ikke svar på.

Til ære for OpenAI ser det ut til veldig klar over farene. Den sier at DALL-E 2 aldri vil være fullt tilgjengelig for publikum, og vil bare sakte rulles ut til pålitelige forskere og partnere basert på tilbakemeldinger. Brukere må si hvorfor de bruker programvaren og kan ikke lage bilder som er uanstendige eller skadelige.

Den ønsker å sikre at feilinformasjon eller dypt forfalskede bilder ikke ender opp med å forårsake ytterligere ødeleggelse for våre politiske systemer og nettbaserte diskurser også.

 

Se dette innlegget på Instagram

 

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Disse intensjonene kan være gode nok, men hvem kan si at andre, mindre velmenende kodere ikke bare vil kopiere OpenAIs arbeid? Vi har allerede sett en applikasjon kalt Wombo's Dream lansering i fjor, tydelig basert på dette konseptet.

Du kan få tilgang til den akkurat nå – selv om den er langt mindre sofistikert enn DALL-E 2.

Til syvende og sist har vi ingen anelse om hvordan denne teknologien kan påvirke kunstverdenen. Hva vi do vet er at ting begynner å bli skremmende imponerende, kanskje til og med en litt uhyggelig dal. Foreløpig ser det ut til at OpenAI ruller ut produktene sine på en ansvarlig måte – og det er det beste vi kan håpe på på dette tidlige stadiet.

tilgjengelighet