Googles Lumiere genererar realistiska AI-videor från textmeddelanden

kultur
Designa
Upplagd 30 januari 2024

Kredit: Google Lumiere

By Jamie Watts

London, Storbritannien

1 energi + Lägg till energi

0 kommentarer

AI-video förvandlas snabbt från kuslig dal till genuint realistisk, och Googles Lumiere är den mest sofistikerade text-till-video-generator vi har sett hittills.

Google framkallade en känsla av vördnad – och en rejäl dos oro – Google visade nyligen hur sofistikerad AI-video har blivit på bara några år av utveckling.

På samma sätt som text-till-bild-generatorer som Bing Image Creator, DALL-E och Midjourney kan skapa originalbilder från en enradsuppmaning, Googles 'lumiere' applikation kan förvandla våra vildaste idéer till fullständigt renderade fem sekunders videor.

Andra exempel på text-till-video-generatorer finns redan tillgängliga, men Googles försök är det första som verkligen spikar en korrekt bild av rörelse till en nära CGI-standard.

Den uppnår detta genom att skapa en basram och använda dess mycket framstående STUNet (Space-Time-U-Net) teknologi för att självständigt fastställa var är hur objekt i bilden ska flyttas. När de väl har valts består objekt inom den initiala ramen av flera egna lager som flyter in i varandra sömlöst.

https://youtu.be/wxLr02Dz2Sc

Lumiere kan generera 80 bildrutor per bild jämfört med det tidigare maximum på 25 som uppnåddes av sin närmaste konkurrent Stable Video Diffusion. Även om flera tidiga resultat som släppts av Google har en touch av konstgjordhet, är språnget i övergripande kvalitet sedan dess INTE en demo är häpnadsväckande.

Utöver text-till-video, finns det också bild-till-video-generering som kommer att ge liv till en stillbild, stiliserad generering, som kan skapa videor i en specifik visuell stil, och en filminställning som kan animera en specifik del av en befintlig bild – som rinnande vatten, en fladdrande eld eller rök från en tågmotor, till exempel.

När det gäller marknadsstrategi faller den sena ankomsten av Lumiere i linje med Googles trendmässigt sena policy. Sedan den tidiga iterationen av dess generativa språkverktyg Bard floppade förra året har teknikjätten i tysthet utvecklat sin multimodala vision för generativ AI i bakgrunden.

https://youtu.be/jV1vkHv4zq8

Google's newest and most capable AI | Gemini (https://youtu.be/jV1vkHv4zq8)

Dess senaste tillkännagivande följer noga ett uppvisningsfönster för Googles Gemini-språkmodell, som är tippad att göra en sen utmaning för ChatGPTs krona som riktmärke för sektorn.

Om man ser bortom det kommersiella buzzet för video-AI, skulle det vara försumligt att ignorera teknikens potential för missbruk eftersom det blir svårare att skilja fiktiva verk från verkligt innehåll.

Det pågående debaclet som involverar sexuellt explicita skildringar av Taylor Swift och hennes likhet med text-till-bild-appar kan vara bara toppen av isberget om text-till-video tar fart i en liknande skala.

Google försäkrar att det skapar skyddsåtgärder för att säkerställa rättvis användning av Lumiere, men tidningens författare har inte ratificerat exakt hur incidenter kommer att förhindras. Vi är angelägna om att lägga vantarna på tekniken, men inte om den kommer att öppna en större burk med maskar.

Jamie Watts

Teknisk redaktör London, Storbritannien

Jag heter Jamie (han/han), biträdande redaktör och senior skribent på Thred. Att hänga med i uppdateringar av sociala medier och revolutionerande teknik är min starka sida, men när jag är borta från mitt tangentbord kommer du förmodligen att hitta mig omsluten av en stor Tango-is-explosion vid den senaste mediokra skräckfilmen. Följ mig på Twitter, LinkedIn och släpp mig några idéer / feedback via e-postadress.

Mer från thred.

Kredit: Unsplash

offbeat

Förklara uppkomsten av sömnturism

På väg att bli en av de största trenderna inom wellnessbranschen, avstår fler och fler resenärer från resplaner fullproppade med aktiviteter till förmån för kuddmenyer och en tidig kväll. En semester kan vara många saker; för vissa innebär det utforskning, äventyr och att prova lokala rätter. För andra är det en möjlighet att luta sig tillbaka och koppla av, att inte göra något annat än att sitta vid poolen i en eller två veckor innan...

By Sofia Philips London, Storbritannien

Kredit: Thred

Media

Netflixs hemliga AI-användning väcker debatt om mediamanipulation

Netflix har blivit utsatt för kritik för att ha inkluderat hemliga AI-bilder i en ny dokumentär om sanna brott. Motreaktionen har utlöst viktiga samtal kring mediamanipulation. Gilla det, frukta det eller avsky det, AI är nu en del av vår vardag. Från utbildning till underhållning, artificiell intelligens kommer bara att fortsätta växa och forma nästan varje aspekt av vår interaktion med media. Men dessa förändringar kräver gränser. Båda AI...

By Flo Bellinger Brighton, UK

"Bioniskt öga" löser mysteriet om Platons sista viloplats

Kredit: Thred

offbeat

"Bioniskt öga" löser mysteriet om Platons sista viloplats

Den italienska forskaren Graziano Ranocchia kan äntligen ha löst mysteriet med Platons sista viloplats. Ett AI-drivet "bioniskt öga" skannade en 2,000 348 år gammal karboniserad rulle skriven runt XNUMX f.Kr. som pekade ut en specifik plats i Aten. Mysteriet om var en av världens största filosofer vilar kan just ha lösts – av en maskin, ironiskt nog. Begravningen av Platon, utan tvekan den mest vördade av den grekiska filosofins grundläggande tänkare...

By Jamie Watts London, Storbritannien

Naturen har officiellt blivit en musiker

Kredit: Pexels

Media

Naturen har officiellt blivit en musiker

Som en del av en ny kampanj har naturen blivit erkänd som en artist på stora streamingplattformar, inklusive Spotify. Royalties kommer att gå till att stödja klimatåtgärdsinitiativ över hela världen. Temperaturerna stiger, livsmiljöerna minskar och glaciärerna smälter i en aldrig tidigare skådad hastighet. När klimatet förändras, fortsätter jordens lidande att nå nya höjder, och verkligheten att vi får ont om tid för att göra något åt det blir...

By Sofia Philips London, Storbritannien

Googles Lumiere genererar realistiska AI-videor från textmeddelanden

AI-video förvandlas snabbt från kuslig dal till genuint realistisk, och Googles Lumiere är den mest sofistikerade text-till-video-generator vi har sett hittills.

Googles "AMIE" banar väg för AI-driven medicin

Googles anställda kallar Bard "värre än värdelös"

"Bioniskt öga" löser mysteriet om Platons sista viloplats

Mer från thred.

"Bioniskt öga" löser mysteriet om Platons sista viloplats

AI-video förvandlas snabbt från kuslig dal till genuint realistisk, och Googles Lumiere är den mest sofistikerade text-till-video-generator vi har sett hittills.

Relaterade artiklar

Googles "AMIE" banar väg för AI-driven medicin

Googles anställda kallar Bard "värre än värdelös"

Populära

Vad är "Dead Internet Theory" och är den verklig?

"Bioniskt öga" löser mysteriet om Platons sista viloplats

Naturen har officiellt blivit en musiker

Håll dig uppdaterad med thred genom att registrera dig för vårt planet-positiva nyhetsbrev!

Mer från thred.

Förklara uppkomsten av sömnturism

Netflixs hemliga AI-användning väcker debatt om mediamanipulation

"Bioniskt öga" löser mysteriet om Platons sista viloplats

Naturen har officiellt blivit en musiker