Nye AI DALL-E 2 lager bilder fra tekstmeldinger

Kultur
utforming
Lagt ut 14. april, 2022

Kreditt: OpenAI

By Charlie Coombs

London, Storbritannia

2 energi - Fjern energi

0 kommentarer

Et nytt AI-system kan lage en rekke bilder både realistiske og surrealistiske fra naturspråklige beskrivelser. Det har potensial til å endre spillet, men ikke uten noen bekymringer.

Algoritmer og kunstig intelligens fortsetter å skape bølger over hele kunstindustrien.

Det siste gjennombruddet kommer fra et forskerteam kalt OpenAI, som nettopp har avduket en ny versjon av DALL-E-programmet sitt. Denne programvaren er et tekst-til-bilde-genereringsverktøy som produserer kunstverk basert på en brukerinntastet beskrivelse.

Se dette innlegget på Instagram

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Denne nye kunstige intelligensen, passende kalt DALL-E 2, vil ikke være tilgjengelig for publikum, men forskere kan registrere seg for å forhåndsvise funksjonene. OpenAI sier at de planlegger å gjøre programvaren sin tilgjengelig for bruk i tredjepartsapper etter hvert - men ingen ord om når dette vil skje.

Foreløpig vil programmet bli testet av godkjente partnere.

Brukere har ikke lov til å laste opp genererte bilder som kan "skade", og må opplyse om hva de bruker AI til.

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

Hvordan fungerer DALL-E 2?

Selv om jeg på ingen måte er en kodeekspert, har jeg kan bekrefte at DALL-E 2 fungerer ved hjelp av et forhåndsbygd bildebibliotek. Algoritmen får et vell av merkede bilder og lager deretter nye kunstverk basert på det den allerede vet.

Si at du ville lage et bilde av en tiger på en kano. Rart, ikke sant? Men DALL-E 2 vil søke i filene sine for å finne hvordan en "kano" og en "tiger" begge ser ut, og skape et enkelt stykke som på overbevisende måte kombinerer begge.

Se dette innlegget på Instagram

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

DALL-E 2 bygger på den første iterasjonens CLIP, et datasynssystem. OpenAI sier at denne nye programvaren genererer bilder ved hjelp av 'diffusjon', der et stykke begynner som noen få prikker og gradvis fylles ut med detaljer.

Denne prosessen skjer via en to-trinns modell. CLIP matcher først teksten din med andre eksisterende fotografier og bilder, deretter genererer en 'dekoder' selve bildet.

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

Videoen ovenfor gir en kort demonstrasjon av hva som er mulig, og viser frem AI-genererte katter, realistisk redigerte versjoner av allerede eksisterende bilder og et komplekst system med objektmerking som lar DALL-E 2 forstå spørsmålene dine. Det er virkelig imponerende greier.

Interessant nok understreker OpenAI at det fortsatt er feil og problemer som må løses.

Se dette innlegget på Instagram

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Objekter som er feilmerket kan føre til at algoritmen produserer feil bilder som ikke stemmer overens med tekstbeskrivelsen. Hvis den i kodingen har et forhåndseksisterende bilde av en bil merket som et "fly", for eksempel, kan dette føre generatoren helt ut av kurs, og sende tilbake en BMW i stedet for en Boeing.

I tillegg er veldig spesifikke spørsmål ikke mulig før AI har merket og lært hva de relevante objektene er.

Å spørre etter en by eller sjeldne dyrearter kan føre til usikre, feilaktige bilder inntil algoritmen er forbedret. Husk at dette bare er den andre iterasjonen av DALL-E, så vi vil uten tvil se enda flere tankevekkende demoer i fremtiden.

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

How does DALL·E 2 work? (OpenAI text-to-image model explained) (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

Hvorfor kan dette skape problemer for artister?

Etter å ha lest kunstverket laget av DALL-E 2, er det vanskelig å ikke føle seg begeistret over mulighetene til teknologien.

Vi bør imidlertid være oppmerksomme på potensielle fallgruver. Kunstnere har allerede svært vanskelig for å tjene penger for arbeidet sitt i internettalderen – derav den første årsaken til NFT-er – og et nytt algoritmebasert bildeverktøy kan sette mange små digitale illustratører ut av drift.

Se dette innlegget på Instagram

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Det vil også bli mye vanskeligere å verifisere ektheten til et bilde eller maleri på nettet, og kan devaluere arbeidet til ekte mennesker. Instant image preging kan bli en mulighet, og skape et enda mer utnyttende NFT-marked.

Hvis alle kan lage hva som helst umiddelbart, mister illustrasjoner og malerier all sin kommersielle verdi? Blir kunst i seg selv bare en annen applikasjon eller et verktøy for alle å bruke?

Se dette innlegget på Instagram

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Det er store, eksistensielle spørsmål angående implikasjonene av en slik genuint banebrytende programvare, mange av dem har vi ikke svar på.

Til ære for OpenAI ser det ut til veldig klar over farene. Den sier at DALL-E 2 aldri vil være fullt tilgjengelig for publikum, og vil bare sakte rulles ut til pålitelige forskere og partnere basert på tilbakemeldinger. Brukere må si hvorfor de bruker programvaren og kan ikke lage bilder som er uanstendige eller skadelige.

Den ønsker å sikre at feilinformasjon eller dypt forfalskede bilder ikke ender opp med å forårsake ytterligere ødeleggelse for våre politiske systemer og nettbaserte diskurser også.

Se dette innlegget på Instagram

Et innlegg delt av DALL·E av OpenAI (@openaidalle)

Disse intensjonene kan være gode nok, men hvem kan si at andre, mindre velmenende kodere ikke bare vil kopiere OpenAIs arbeid? Vi har allerede sett en applikasjon kalt Wombo's Dream lansering i fjor, tydelig basert på dette konseptet.

Du kan få tilgang til den akkurat nå – selv om den er langt mindre sofistikert enn DALL-E 2.

Til syvende og sist har vi ingen anelse om hvordan denne teknologien kan påvirke kunstverdenen. Hva vi do vet er at ting begynner å bli skremmende imponerende, kanskje til og med en litt uhyggelig dal. Foreløpig ser det ut til at OpenAI ruller ut produktene sine på en ansvarlig måte – og det er det beste vi kan håpe på på dette tidlige stadiet.

Charlie Coombs

Sjefredaktør London, Storbritannia

Jeg er Charlie (han/han), sjefredaktøren i Thred. Jeg studerte engelsk ved University of Birmingham, og som musikk- og spillentusiast er jeg en nerd for popkultur. Du kan finne meg som kuraterer spillelister, designer artikkeloverskrifter og nipper til cider på en torsdag. Følg meg på Twitter, Linkedin og send meg noen ideer / tilbakemeldinger via emalje.

Mer fra thred.

'Bionisk øye' løser mysteriet om Platons siste hvilested

Kreditt: Thred

offbeat

'Bionisk øye' løser mysteriet om Platons siste hvilested

Den italienske forskeren, Graziano Ranocchia, kan endelig ha løst mysteriet om Platons siste hvilested. Et AI-drevet "bionisk øye" skannet en 2,000 år gammel karbonisert rulle skrevet rundt 348 f.Kr. som fant et bestemt sted i Athen. Mysteriet om hvor en av verdens største filosofer hviler kan nettopp ha blitt løst – av en maskin, ironisk nok. Begravelsen av Platon, uten tvil den mest ærede av de grunnleggende tenkerne i gresk filosofi ...

By Jamie Watts London, Storbritannia

Kreditt: Pexels

Media

Naturen har offisielt blitt en musiker

Som en del av en ny kampanje har naturen blitt anerkjent som en artist på store strømmeplattformer, inkludert Spotify. Royalties vil gå til å støtte klimatiltak over hele verden. Temperaturene øker, habitatene minker, og isbreer smelter med en enestående hastighet. Etter hvert som klimaet endres, fortsetter jordens lidelse å nå nye høyder, og realiteten at vi går tom for tid til å gjøre noe med det blir...

By Sofia Phillips London, Storbritannia

Hva er "Dead Internet Theory" og er den ekte?

Kreditt: Thred

offbeat

Hva er "Dead Internet Theory" og er den ekte?

Med den ustanselige veksten av AI siden 2022, har konspirasjoner rundt den såkalte "Dead Internet Theory" vokst seg sterkere. Men det første er først, hva i helvete er det og har det noen troverdighet? Er dette et online kaninhull det er verdt å gå seg vill i? Er det ren storm i en kopp? Har et menneske i det hele tatt skrevet denne artikkelen? Så mange spørsmål. Hvis du bruker betydelig tid på Twitter (X)...

By Jamie Watts London, Storbritannia

Kreditt: Unsplash

offbeat

Hva er «voksne år» og hvorfor øker de?

Vanligvis er det en pre-uni rite of passage for tenåringer og folk i begynnelsen av 20-årene, å sette alt på vent for å reise verden rundt er raskt i ferd med å bli en trend blant eldre generasjoner som leter etter en pause fra livets nådeløse natur som voksen. Typisk assosiert med randen av voksenlivet, er et friår en utviklingsperiode for de som har tid og ressurser til å reise, jobbe frivillig,...

By Sofia Phillips London, Storbritannia