Googles Lumiere generiert aus Textansagen realistische KI-Videos

KULTUR
Design
Veröffentlicht am 30. Januar 2024

Bildnachweis: Google Lumiere

By Jamie Watt

London, Vereinigtes Königreich

1 Energie + Energie hinzufügen

0 Kommentare

KI-Video entwickelt sich schnell von einem unheimlichen Tal zu einem wirklich realistischen Video, und Googles Lumiere ist der fortschrittlichste Text-zu-Video-Generator, den wir bisher gesehen haben.

Mit einem Gefühl der Ehrfurcht – und einer großen Portion Unbehagen – hat Google kürzlich gezeigt, wie ausgefeilt KI-Videos in nur wenigen Jahren der Entwicklung geworden sind.

Auf die gleiche Weise, wie Text-zu-Bild-Generatoren wie Bing Image Creator, DALL-E und Midjourney Originalbilder aus einer einzeiligen Eingabeaufforderung erstellen können, bietet Googles „LumiereDie Anwendung kann unsere wildesten Ideen in vollständig gerenderte Fünf-Sekunden-Videos umwandeln.

Andere Beispiele für Text-zu-Video-Generatoren sind zwar bereits verfügbar, aber Googles Versuch ist der erste, eine wirklich genaue Bewegungsdarstellung nahezu auf CGI-Standard zu bringen.

Dies wird erreicht, indem ein Grundrahmen erstellt und dessen vielgepriesenes verwendet wird STUNet (Space-Time-U-Net)-Technologie zur autonomen Festlegung, wohin sich Elemente im Bild bewegen sollen. Nach der Auswahl bestehen Objekte innerhalb dieses anfänglichen Rahmens aus mehreren eigenen Ebenen, die nahtlos ineinander übergehen.

https://youtu.be/wxLr02Dz2Sc

Lumiere ist in der Lage, 80 Bilder pro Bild zu erzeugen, verglichen mit dem vorherigen Maximum von 25, das sein nächster Konkurrent Stable Video Diffusion erreichte. Obwohl mehrere frühe von Google veröffentlichte Ergebnisse einen Hauch von Künstlichkeit an sich haben, ist der Sprung in der Gesamtqualität seitdem so weit 2022-Demo ist umwerfend.

Über die Text-zu-Video-Generierung hinaus gibt es auch die Bild-zu-Video-Generierung, die ein Standbild zum Leben erweckt, die stilisierte Generierung, mit der Videos in einem bestimmten visuellen Stil erstellt werden können, und eine Kinemografen-Einstellung, mit der ein bestimmter Teil eines Bildes animiert werden kann vorhandenes Bild – zum Beispiel fließendes Wasser, ein flackerndes Feuer oder der Rauch einer Lokomotive.

Was die Marktstrategie betrifft, steht die späte Ankunft von Lumiere im Einklang mit Googles modischer Spätpolitik. Seit der frühen Iteration seines generativen Sprachtools Bard floppte Letztes Jahr hat der Technologieriese im Hintergrund seine multimodale Vision für generative KI entwickelt.

https://youtu.be/jV1vkHv4zq8

Google's newest and most capable AI | Gemini (https://youtu.be/jV1vkHv4zq8)

Seine jüngste Ankündigung folgt eng auf eine Präsentation des Gemini-Sprachmodells von Google, das voraussichtlich eine späte Herausforderung für ChatGPTs Krone als Benchmark für die Branche darstellen wird.

Abgesehen von der kommerziellen Begeisterung für Video-KI wäre es nachlässig, das Missbrauchspotenzial der Technologie zu ignorieren, da es immer schwieriger wird, fiktive Werke von realen Inhalten zu unterscheiden.

Das anhaltende Debakel um sexuell eindeutige Darstellungen von Taylor Swift und ihre Ähnlichkeit mit Text-zu-Bild-Apps könnte nur die Spitze des Eisbergs sein, wenn Text-zu-Video in ähnlichem Ausmaß durchstartet.

Google versichert, Sicherheitsvorkehrungen zu treffen, um eine faire Nutzung von Lumiere zu gewährleisten, die Autoren des Papiers haben jedoch nicht genau festgelegt, wie Vorfälle verhindert werden sollen. Wir sind sehr daran interessiert, die Technologie in die Hände zu bekommen, aber nicht, wenn sie ein größeres Büchse voller Würmer öffnet.

Jamie Watt

Technischer Redakteur London, Vereinigtes Königreich

Ich bin Jamie (Er/Er), stellvertretender Herausgeber und leitender Autor bei Thred. Mit Social-Media-Updates und revolutionärer Technologie Schritt zu halten, ist meine Stärke, aber wenn ich nicht an meiner Tastatur bin, werdet ihr mich wahrscheinlich beim neuesten mittelmäßigen Horrorfilm um einen großen Tango-Eisstoß gewickelt finden. Folge mir auf Twitter, LinkedIn und schick mir ein paar Ideen/Feedback via Email.

Mehr von thred.

Meinung – FKA Twigs beweist, dass KI Künstler stärken kann

Bildnachweis: Wikimedia Commons

Medien

Meinung – FKA Twigs beweist, dass KI Künstler stärken kann

Die Sängerin hat eine KI-Version ihrer selbst vorgeschlagen, um ihre Arbeitsbelastung auszugleichen. Die Reaktion war gemischt, aber Twigs nickt einer kraftvollen Zukunft zu. Es ist bekannt, dass FKA Twigs die Kreativität verwischt Technologie. Ihre ätherische Musik, Filme und Tanzeinlagen – neben Kunst- und Modeprojekten – haben immer die Grenzen überschritten und ihre Position in der Populärkultur gefestigt. Obwohl Twigs weltweite Berühmtheit erlangte, hat sie nie aufgegeben ...

By Flo Bellinger Brighton, UK

Erklärung des Aufstiegs des Schlaftourismus

Gutschrift: Unsplash

unkonventionell

Erklärung des Aufstiegs des Schlaftourismus

Immer mehr Reisende, die sich schnell zu einem der größten Trends in der Wellnessbranche entwickeln, verzichten zugunsten von Kissenmenüs und einer frühen Nacht auf Reiserouten voller Aktivitäten. Ein Urlaub kann viele Dinge sein; Für manche bedeutet es Erkundung, Abenteuer und das Probieren lokaler Küche. Für andere ist es eine Gelegenheit, sich zurückzulehnen und zu entspannen und ein oder zwei Wochen lang nichts anderes zu tun, als am Pool zu faulenzen, bevor ...

By Sofia Phillips London, Vereinigtes Königreich

Kredit: Thred

Medien

Netflix‘ geheim gehaltener KI-Einsatz entfacht Debatte über Medienmanipulation

Netflix ist in die Kritik geraten, weil es in einer neuen Dokumentation über wahre Kriminalität unbekannte KI-Bilder verwendet hat. Die Gegenreaktion hat wichtige Gespräche über Medienmanipulation ausgelöst. Egal, ob Sie es mögen, fürchten oder verabscheuen: KI ist mittlerweile Teil unseres Alltags. Von der Bildung bis zur Unterhaltung wird die künstliche Intelligenz weiter wachsen und nahezu jeden Aspekt unserer Interaktion mit den Medien prägen. Aber diese Veränderungen erfordern Grenzen. Beide KIs...

By Flo Bellinger Brighton, UK

„Bionisches Auge“ lüftet Rätsel um Platons letzte Ruhestätte

Kredit: Thred

unkonventionell

„Bionisches Auge“ lüftet Rätsel um Platons letzte Ruhestätte

Der italienische Forscher Graziano Ranocchia hat möglicherweise endlich das Rätsel um Platons letzte Ruhestätte gelöst. Ein KI-gestütztes „bionisches Auge“ scannte eine 2,000 Jahre alte verkohlte Schriftrolle, die um 348 v. Chr. geschrieben wurde und einen bestimmten Ort in Athen identifizierte. Das Rätsel, wo einer der größten Philosophen der Welt ruht, wurde möglicherweise gerade erst gelöst – ironischerweise durch eine Maschine. Das Begräbnis von Platon, dem wohl am meisten verehrten Grunddenker der griechischen Philosophie ...

By Jamie Watt London, Vereinigtes Königreich

Googles Lumiere generiert aus Textansagen realistische KI-Videos

KI-Video entwickelt sich schnell von einem unheimlichen Tal zu einem wirklich realistischen Video, und Googles Lumiere ist der fortschrittlichste Text-zu-Video-Generator, den wir bisher gesehen haben.

Googles „AMIE“ ebnet den Weg für eine KI-gesteuerte Medizin

Google-Mitarbeiter nennen Bard angeblich „schlimmer als nutzlos“

„Bionisches Auge“ lüftet Rätsel um Platons letzte Ruhestätte

Mehr von thred.

Meinung – FKA Twigs beweist, dass KI Künstler stärken kann

„Bionisches Auge“ lüftet Rätsel um Platons letzte Ruhestätte

KI-Video entwickelt sich schnell von einem unheimlichen Tal zu einem wirklich realistischen Video, und Googles Lumiere ist der fortschrittlichste Text-zu-Video-Generator, den wir bisher gesehen haben.

In Verbindung stehende Artikel

Googles „AMIE“ ebnet den Weg für eine KI-gesteuerte Medizin

Google-Mitarbeiter nennen Bard angeblich „schlimmer als nutzlos“

Beliebt

„Bionisches Auge“ lüftet Rätsel um Platons letzte Ruhestätte

Die Natur ist offiziell zum Musiker geworden

Netflix‘ geheim gehaltener KI-Einsatz entfacht Debatte über Medienmanipulation

Bleiben Sie auf dem Laufenden, indem Sie sich für unseren planet-positiven Newsletter anmelden!

Mehr von thred.

Meinung – FKA Twigs beweist, dass KI Künstler stärken kann

Erklärung des Aufstiegs des Schlaftourismus

Netflix‘ geheim gehaltener KI-Einsatz entfacht Debatte über Medienmanipulation

„Bionisches Auge“ lüftet Rätsel um Platons letzte Ruhestätte