Et nytt AI-system kan lage en rekke bilder både realistiske og surrealistiske fra naturspråklige beskrivelser. Det har potensial til å endre spillet, men ikke uten noen bekymringer.
Algoritmer og kunstig intelligens fortsetter å skape bølger over hele kunstindustrien.
Det siste gjennombruddet kommer fra et forskerteam kalt OpenAI, som nettopp har avduket en ny versjon av DALL-E-programmet sitt. Denne programvaren er et tekst-til-bilde-genereringsverktøy som produserer kunstverk basert på en brukerinntastet beskrivelse.
Se dette innlegget på Instagram
Denne nye kunstige intelligensen, passende kalt DALL-E 2, vil ikke være tilgjengelig for publikum, men forskere kan registrere seg for å forhåndsvise funksjonene. OpenAI sier at de planlegger å gjøre programvaren sin tilgjengelig for bruk i tredjepartsapper etter hvert - men ingen ord om når dette vil skje.
Foreløpig vil programmet bli testet av godkjente partnere.
Brukere har ikke lov til å laste opp genererte bilder som kan "skade", og må opplyse om hva de bruker AI til.
Hvordan fungerer DALL-E 2?
Selv om jeg på ingen måte er en kodeekspert, har jeg kan bekrefte at DALL-E 2 fungerer ved hjelp av et forhåndsbygd bildebibliotek. Algoritmen får et vell av merkede bilder og lager deretter nye kunstverk basert på det den allerede vet.
Si at du ville lage et bilde av en tiger på en kano. Rart, ikke sant? Men DALL-E 2 vil søke i filene sine for å finne hvordan en "kano" og en "tiger" begge ser ut, og skape et enkelt stykke som på overbevisende måte kombinerer begge.
Se dette innlegget på Instagram
DALL-E 2 bygger på den første iterasjonens CLIP, et datasynssystem. OpenAI sier at denne nye programvaren genererer bilder ved hjelp av 'diffusjon', der et stykke begynner som noen få prikker og gradvis fylles ut med detaljer.
Denne prosessen skjer via en to-trinns modell. CLIP matcher først teksten din med andre eksisterende fotografier og bilder, deretter genererer en 'dekoder' selve bildet.
Videoen ovenfor gir en kort demonstrasjon av hva som er mulig, og viser frem AI-genererte katter, realistisk redigerte versjoner av allerede eksisterende bilder og et komplekst system med objektmerking som lar DALL-E 2 forstå spørsmålene dine. Det er virkelig imponerende greier.
Interessant nok understreker OpenAI at det fortsatt er feil og problemer som må løses.
Se dette innlegget på Instagram
Objekter som er feilmerket kan føre til at algoritmen produserer feil bilder som ikke stemmer overens med tekstbeskrivelsen. Hvis den i kodingen har et forhåndseksisterende bilde av en bil merket som et "fly", for eksempel, kan dette føre generatoren helt ut av kurs, og sende tilbake en BMW i stedet for en Boeing.
I tillegg er veldig spesifikke spørsmål ikke mulig før AI har merket og lært hva de relevante objektene er.
Å spørre etter en by eller sjeldne dyrearter kan føre til usikre, feilaktige bilder inntil algoritmen er forbedret. Husk at dette bare er den andre iterasjonen av DALL-E, så vi vil uten tvil se enda flere tankevekkende demoer i fremtiden.