Lumiere Google menghasilkan video AI yang realistis dari perintah teks

budaya
Mendesain
Diposting 30 Januari 2024

Kredit: Google Lumiere

By Jamie Watts

London, UK

1 energi + Tambahkan Energi

komentar 0

Video AI dengan cepat berubah dari lembah yang luar biasa menjadi benar-benar realistis, dan Lumiere dari Google adalah generator teks-ke-video paling canggih yang pernah kami lihat hingga saat ini.

Membangkitkan rasa kagum – dan banyak kegelisahan – Google baru-baru ini menunjukkan betapa canggihnya video AI hanya dalam beberapa tahun pengembangan.

Dengan cara yang sama seperti generator teks-ke-gambar seperti Bing Image Creator, DALL-E, dan Midjourney dapat membuat gambar asli dari perintah satu baris, 'lumiereAplikasi ' dapat mengubah ide terliar kita menjadi video berdurasi lima detik yang dirender sepenuhnya.

Contoh lain dari generator teks-ke-video sudah tersedia, tetapi upaya Google adalah yang pertama untuk benar-benar memberikan gambaran akurat tentang pergerakan hingga mendekati standar CGI.

Hal ini dicapai dengan membangun kerangka dasar dan menggunakan kerangka yang sangat digembar-gemborkan STUNet Teknologi (Space-Time-U-Net) yang secara mandiri menentukan di mana objek dalam gambar harus bergerak. Setelah dipilih, objek dalam bingkai awal tersebut kemudian terdiri dari beberapa lapisannya sendiri yang mengalir satu sama lain dengan mulus.

https://youtu.be/wxLr02Dz2Sc

Lumiere mampu menghasilkan 80 frame per gambar dibandingkan dengan maksimum sebelumnya yaitu 25 frame yang dicapai oleh pesaing terdekatnya, Stable Video Diffusion. Meskipun beberapa hasil awal yang dirilis oleh Google memiliki sentuhan kepalsuan, terjadi lompatan dalam kualitas secara keseluruhan sejak hasil tersebut BUKAN demo mengejutkan.

Selain teks-ke-video, ada juga generasi gambar-ke-video yang akan menghidupkan gambar diam, generasi bergaya, yang dapat membuat video dengan gaya visual tertentu, dan pengaturan sinematografi yang dapat menganimasikan bagian tertentu dari sebuah video. gambaran yang ada – seperti air yang mengalir, kerlap-kerlip api, atau asap dari mesin kereta api, misalnya.

Dalam hal strategi pasar, keterlambatan kedatangan Lumiere sejalan dengan kebijakan Google yang sangat terlambat. Sejak iterasi awal alat bahasa generatifnya Bard terjatuh tahun lalu, raksasa teknologi ini diam-diam mengembangkan visi multimodalnya untuk AI generatif.

https://youtu.be/jV1vkHv4zq8

Google's newest and most capable AI | Gemini (https://youtu.be/jV1vkHv4zq8)

Pengumuman terbarunya mengikuti pameran model bahasa Gemini Google, yang diperkirakan akan menjadi tantangan terlambat bagi mahkota ChatGPT sebagai tolok ukur untuk sektor ini.

Melihat lebih jauh dari hiruk pikuk komersial AI video, kita tidak boleh mengabaikan potensi penyalahgunaan teknologi karena semakin sulit membedakan karya fiksi dan konten kehidupan nyata.

Bencana yang sedang berlangsung yang melibatkan penggambaran yang eksplisit secara seksual Taylor Swift dan kemiripannya dalam menggunakan aplikasi teks-ke-gambar mungkin hanyalah puncak gunung es jika teks-ke-video berkembang pesat dalam skala yang sama.

Google memastikan bahwa mereka menciptakan perlindungan untuk memastikan penggunaan Lumiere secara adil, namun penulis makalah tersebut belum meratifikasi secara pasti bagaimana insiden dapat dicegah. Kami sangat ingin mendapatkan teknologi ini, namun hal ini tidak akan membuka peluang lebih besar bagi kita.

Jamie Watts

Editor Teknologi London, UK

Saya Jamie (Dia/Dia), Wakil Editor dan Penulis Senior di Thred. Mengikuti pembaruan media sosial dan teknologi revolusioner adalah keahlian saya, tetapi saat jauh dari keyboard saya, Anda mungkin akan menemukan saya terbungkus semburan es Tango besar di film horor terbaru yang biasa-biasa saja. Ikuti saya di Twitter, LinkedIn dan berikan saya beberapa ide/umpan balik melalui email.

Lebih banyak dari utas.

Opini – FKA Twigs membuktikan AI dapat memberdayakan seniman

Kredit: Wikimedia Commons

Media

Opini – FKA Twigs membuktikan AI dapat memberdayakan seniman

Penyanyi tersebut telah mengusulkan versi AI dirinya untuk menyeimbangkan beban kerjanya. Tanggapannya beragam, tetapi Twigs menyetujui masa depan yang memberdayakan. FKA Twigs dikenal mengaburkan kreativitas teknologi. Musik, film, dan rutinitas tariannya yang halus – serta usaha seni dan fesyen – selalu mendobrak batasan dan mengukuhkan posisinya dalam budaya populer. Meskipun mencapai tingkat ketenaran global, Twigs tidak pernah melepaskannya...

By Flo Bellinger Brighton, UK

Kredit: Unsplash

offbeat

Menjelaskan kebangkitan wisata tidur

Dengan cepat menjadi salah satu tren terbesar dalam industri kesehatan, semakin banyak wisatawan yang meninggalkan rencana perjalanan yang penuh dengan aktivitas dan memilih menu bantal dan tidur malam lebih awal. Liburan bisa berarti banyak hal; bagi sebagian orang, ini melibatkan eksplorasi, petualangan, dan mencoba masakan lokal. Bagi yang lain, ini adalah kesempatan untuk duduk dan bersantai, tidak melakukan apa pun selain bersantai di tepi kolam renang selama satu atau dua minggu sebelum...

By Sofia Philips London, UK

Kredit: Benang

Media

Penggunaan AI yang dirahasiakan oleh Netflix memicu perdebatan mengenai manipulasi media

Netflix mendapat kecaman karena memasukkan citra AI yang dirahasiakan dalam film dokumenter kriminal terbaru. Reaksi balik tersebut telah memicu perbincangan penting seputar manipulasi media. Suka, takut, atau benci, AI kini menjadi bagian dari kehidupan kita sehari-hari. Dari pendidikan hingga hiburan, kecerdasan buatan akan terus berkembang, membentuk hampir setiap aspek interaksi kita dengan media. Namun perubahan ini membutuhkan batasan. Kedua AI...

By Flo Bellinger Brighton, UK

'Mata Bionik' memecahkan misteri tempat peristirahatan terakhir Plato

Kredit: Benang

offbeat

'Mata Bionik' memecahkan misteri tempat peristirahatan terakhir Plato

Peneliti Italia, Graziano Ranocchia, mungkin akhirnya berhasil memecahkan misteri tempat peristirahatan terakhir Plato. 'Mata bionik' bertenaga AI memindai gulungan berkarbon berusia 2,000 tahun yang ditulis sekitar tahun 348 SM yang menunjukkan dengan tepat lokasi tertentu di Athena. Misteri di mana salah satu filsuf terhebat di dunia bersemayam mungkin baru saja terpecahkan – ironisnya, oleh sebuah mesin. Pemakaman Plato, bisa dibilang pemikir dasar filsafat Yunani yang paling dihormati...

By Jamie Watts London, UK

Lumiere Google menghasilkan video AI yang realistis dari perintah teks

Video AI dengan cepat berubah dari lembah yang luar biasa menjadi benar-benar realistis, dan Lumiere dari Google adalah generator teks-ke-video paling canggih yang pernah kami lihat hingga saat ini.

‘AMIE’ Google membuka jalan bagi pengobatan berbasis AI

Karyawan Google dilaporkan menyebut Bard 'lebih buruk daripada tidak berguna'

'Mata Bionik' memecahkan misteri tempat peristirahatan terakhir Plato

Lebih banyak dari utas.

Opini – FKA Twigs membuktikan AI dapat memberdayakan seniman

'Mata Bionik' memecahkan misteri tempat peristirahatan terakhir Plato

Video AI dengan cepat berubah dari lembah yang luar biasa menjadi benar-benar realistis, dan Lumiere dari Google adalah generator teks-ke-video paling canggih yang pernah kami lihat hingga saat ini.

Terkait artikel

‘AMIE’ Google membuka jalan bagi pengobatan berbasis AI

Karyawan Google dilaporkan menyebut Bard 'lebih buruk daripada tidak berguna'

Populer

'Mata Bionik' memecahkan misteri tempat peristirahatan terakhir Plato

Alam telah resmi menjadi musisi

Penggunaan AI yang dirahasiakan oleh Netflix memicu perdebatan mengenai manipulasi media

Ikuti perkembangannya dengan mendaftar ke buletin planet-positif kami!

Lebih banyak dari utas.

Opini – FKA Twigs membuktikan AI dapat memberdayakan seniman

Menjelaskan kebangkitan wisata tidur

Penggunaan AI yang dirahasiakan oleh Netflix memicu perdebatan mengenai manipulasi media

'Mata Bionik' memecahkan misteri tempat peristirahatan terakhir Plato