Googles Lumiere genererer realistiske AI-videoer fra tekstmeldinger

Kultur
utforming
Lagt ut 30. januar 2024

Kreditt: Google Lumiere

By Jamie Watts

London, Storbritannia

1 energi + Legg til energi

0 kommentarer

AI-video går raskt fra uhyggelig dal til virkelig realistisk, og Googles Lumiere er den mest sofistikerte tekst-til-video-generatoren vi har sett til dags dato.

Google fremkalte en følelse av ærefrykt – og en stor dose uro – og viste nylig hvor sofistikert AI-video har blitt på bare noen få år med utvikling.

På samme måte som tekst-til-bilde-generatorer som Bing Image Creator, DALL-E og Midjourney kan lage originale bilder fra en enkeltlinjes melding, Googles 'Lumiere'-applikasjonen kan gjøre våre villeste ideer til fullstendig gjengitte videoer på fem sekunder.

Andre eksempler på tekst-til-video-generatorer er allerede tilgjengelige, gitt, men Googles forsøk er det første som virkelig fanger en nøyaktig fremstilling av bevegelse til en nesten CGI-standard.

Den oppnår dette ved å etablere en bunnramme og bruke den svært utpekte STUNet (Space-Time-U-Net) teknologi for autonomt å fastslå hvor er hvordan elementer i bildet skal bevege seg. Når de er valgt, består objekter innenfor den innledende rammen av flere egne lag som flyter sømløst inn i hverandre.

https://youtu.be/wxLr02Dz2Sc

Lumiere er i stand til å generere 80 bilder per bilde sammenlignet med forrige maksimum på 25 oppnådd av sin nærmeste konkurrent Stable Video Diffusion. Selv om flere tidlige resultater utgitt av Google har et snev av kunstighet over seg, er spranget i generell kvalitet siden det IKKE en demo er svimlende.

Utover tekst-til-video, er det også bilde-til-video-generering som vil bringe et stillbilde til live, stilisert generasjon, som kan lage videoer i en bestemt visuell stil, og en kinografinnstilling som kan animere en bestemt del av en eksisterende bilde – som rennende vann, en flimrende brann eller røyk fra en togmotor, for eksempel.

Når det gjelder markedsstrategi, faller den sene ankomsten av Lumiere i tråd med Googles moteriktige sene policy. Siden den tidlige iterasjonen av det generative språkverktøyet Bard floppet i fjor har teknologigiganten i det stille utviklet sin multimodale visjon for generativ AI i bakgrunnen.

https://youtu.be/jV1vkHv4zq8

Google's newest and most capable AI | Gemini (https://youtu.be/jV1vkHv4zq8)

Den siste kunngjøringen følger tett et utstillingsvindu for Googles Gemini-språkmodell, som er tippet til å gjøre en sen utfordring for ChatGPTs krone som målestokk for sektoren.

Ser man utover den kommersielle buzzen for video-AI, ville det være upassende å ignorere teknologiens potensiale for misbruk ettersom det blir vanskeligere å skille fiktive verk fra virkelighetsinnhold.

Den pågående debakelen som involverer seksuelt eksplisitte skildringer av Taylor Swift og hennes likhet med tekst-til-bilde-apper kan være bare toppen av isfjellet hvis tekst-til-video tar av på en lignende skala.

Google forsikrer at det skaper sikkerhetstiltak for å sikre rettferdig bruk av Lumiere, men avisens forfattere har ikke ratifisert nøyaktig hvordan hendelser skal forhindres. Vi er opptatt av å få tak i teknologien, men ikke om den vil åpne en større boks med ormer.

Jamie Watts

Teknisk redaktør London, Storbritannia

Jeg er Jamie (han/han), nestleder og seniorskribent i Thred. Å følge med på sosiale medier-oppdateringer og revolusjonerende teknologi er min sterke side, men når jeg er borte fra tastaturet, vil du sannsynligvis finne meg viklet rundt en stor Tango-iseksplosjon på den siste middelmådige skrekkfilmen. Følg meg på Twitter, Linkedin og send meg noen ideer / tilbakemeldinger via e-post.

Mer fra thred.

Kreditt: Unsplash

offbeat

Forklarer fremveksten av søvnturisme

I ferd med å bli en av de største trendene i velværebransjen, går flere og flere reisende fra seg reiseruter proppfulle av aktiviteter til fordel for putemenyer og en tidlig kveld. En ferie kan være mange ting; for noen innebærer det utforskning, eventyr og å prøve lokal mat. For andre er det en mulighet til å lene seg tilbake og slappe av, å ikke gjøre annet enn å slappe av ved bassenget i en uke eller to før...

By Sofia Phillips London, Storbritannia

Netflixs ikke avslørte AI-bruk vekker debatt om mediemanipulasjon

Kreditt: Thred

Media

Netflixs ikke avslørte AI-bruk vekker debatt om mediemanipulasjon

Netflix har blitt kritisert for å inkludere ikke avslørte AI-bilder i en ny dokumentar om sann kriminalitet. Tilbakeslaget har utløst viktige samtaler rundt mediemanipulasjon. Lik det, frykt det eller avsky det, AI er nå en del av hverdagen vår. Fra utdanning til underholdning, kunstig intelligens vil bare fortsette å vokse, og forme nesten alle aspekter av vår interaksjon med media. Men disse endringene krever grenser. Begge AI...

By Flo Bellinger Brighton, UK

'Bionisk øye' løser mysteriet om Platons siste hvilested

Kreditt: Thred

offbeat

'Bionisk øye' løser mysteriet om Platons siste hvilested

Den italienske forskeren, Graziano Ranocchia, kan endelig ha løst mysteriet om Platons siste hvilested. Et AI-drevet "bionisk øye" skannet en 2,000 år gammel karbonisert rulle skrevet rundt 348 f.Kr. som fant et bestemt sted i Athen. Mysteriet om hvor en av verdens største filosofer hviler kan nettopp ha blitt løst – av en maskin, ironisk nok. Begravelsen av Platon, uten tvil den mest ærede av de grunnleggende tenkerne i gresk filosofi ...

By Jamie Watts London, Storbritannia

Kreditt: Pexels

Media

Naturen har offisielt blitt en musiker

Som en del av en ny kampanje har naturen blitt anerkjent som en artist på store strømmeplattformer, inkludert Spotify. Royalties vil gå til å støtte klimatiltak over hele verden. Temperaturene øker, habitatene minker, og isbreer smelter med en enestående hastighet. Etter hvert som klimaet endres, fortsetter jordens lidelse å nå nye høyder, og realiteten at vi går tom for tid til å gjøre noe med det blir...

By Sofia Phillips London, Storbritannia

Googles Lumiere genererer realistiske AI-videoer fra tekstmeldinger

AI-video går raskt fra uhyggelig dal til virkelig realistisk, og Googles Lumiere er den mest sofistikerte tekst-til-video-generatoren vi har sett til dags dato.

Googles "AMIE" baner vei for AI-drevet medisin

Google-ansatte kaller angivelig Bard "verre enn ubrukelig"

'Bionisk øye' løser mysteriet om Platons siste hvilested

Mer fra thred.

'Bionisk øye' løser mysteriet om Platons siste hvilested

AI-video går raskt fra uhyggelig dal til virkelig realistisk, og Googles Lumiere er den mest sofistikerte tekst-til-video-generatoren vi har sett til dags dato.

Relaterte artikler

Googles "AMIE" baner vei for AI-drevet medisin

Google-ansatte kaller angivelig Bard "verre enn ubrukelig"

Populær

Hva er "Dead Internet Theory" og er den ekte?

'Bionisk øye' løser mysteriet om Platons siste hvilested

Naturen har offisielt blitt en musiker

Hold deg oppdatert på thred ved å registrere deg for vårt planet-positive nyhetsbrev!

Mer fra thred.

Forklarer fremveksten av søvnturisme

Netflixs ikke avslørte AI-bruk vekker debatt om mediemanipulasjon

'Bionisk øye' løser mysteriet om Platons siste hvilested

Naturen har offisielt blitt en musiker