Lumiere do Google gera vídeos realistas de IA a partir de prompts de texto

Cultura
Design
Postado em 30 de janeiro de 2024

Crédito: Google Lumière

By Jamie Watts

Londres, Reino Unido

1 energia + Adicionar energia

comentários 0

O vídeo AI está mudando rapidamente de um vale misterioso para genuinamente realista, e o Lumiere do Google é o gerador de texto para vídeo mais sofisticado que já vimos até agora.

Evocando um sentimento de admiração – e uma grande dose de desconforto – o Google exibiu recentemente como o vídeo de IA se tornou sofisticado em apenas alguns anos de desenvolvimento.

Da mesma forma que geradores de texto para imagem como Bing Image Creator, DALL-E e Midjourney podem criar imagens originais a partir de um prompt de linha única, o 'Lumiere' pode transformar nossas ideias mais loucas em vídeos de cinco segundos totalmente renderizados.

Outros exemplos de geradores de texto para vídeo já estão disponíveis, é verdade, mas a tentativa do Google é a primeira a realmente conseguir uma representação precisa do movimento em um padrão próximo ao CGI.

Ele consegue isso estabelecendo uma estrutura de base e usando seu altamente elogiado STUNet (Space-Time-U-Net) tecnologia para estabelecer de forma autônoma onde estão e como os itens da imagem devem se mover. Uma vez selecionados, os objetos dentro desse quadro inicial compreendem várias camadas próprias que fluem umas para as outras perfeitamente.

https://youtu.be/wxLr02Dz2Sc

O Lumiere é capaz de gerar 80 quadros por imagem em comparação com o máximo anterior de 25 alcançado por seu concorrente mais próximo, Stable Video Diffusion. Embora vários resultados iniciais divulgados pelo Google tenham um toque de artificialidade, o salto na qualidade geral desde seu lançamento NÃO é uma demonstração é impressionante.

Além do texto para vídeo, há também a geração de imagem para vídeo, que dará vida a uma imagem estática, a geração estilizada, que pode criar vídeos em um estilo visual específico, e um cenário cinematográfico capaz de animar uma parte específica de um imagem existente – como água corrente, um fogo bruxuleante ou fumaça de uma locomotiva de trem, por exemplo.

Em termos de estratégia de mercado, a chegada tardia do Lumière está em linha com a política tardia do Google. Desde a iteração inicial de sua ferramenta de linguagem generativa Bardo fracassou no ano passado, a gigante tecnológica desenvolveu discretamente a sua visão multimodal para IA generativa em segundo plano.

https://youtu.be/jV1vkHv4zq8

Google's newest and most capable AI | Gemini (https://youtu.be/jV1vkHv4zq8)

Seu último anúncio segue de perto uma vitrine do modelo de linguagem Gemini do Google, que deverá representar um desafio tardio à coroa do ChatGPT como referência para o setor.

Olhando além do burburinho comercial da IA de vídeo, seria negligente ignorar o potencial de uso indevido da tecnologia, à medida que se torna mais difícil distinguir obras de ficção de conteúdo da vida real.

O desastre contínuo envolvendo representações sexualmente explícitas de Taylor Swift e sua semelhança usando aplicativos de texto para imagem pode ser apenas a ponta do iceberg se o texto para vídeo decolar em uma escala semelhante.

O Google garante que está criando salvaguardas para garantir o uso justo do Lumiere, mas os autores do artigo não ratificaram exatamente como os incidentes serão evitados. Estamos ansiosos para colocar as mãos na tecnologia, mas não se ela abrir uma lata maior de minhocas.

Jamie Watts

Editor de Tecnologia Londres, Reino Unido

Sou Jamie (Ele/Ele), o editor adjunto e redator sênior da Thred. Acompanhar as atualizações de mídia social e a tecnologia revolucionária é o meu forte, mas quando estiver longe do teclado, você provavelmente me encontrará envolvido em uma grande explosão de gelo de tango no último filme de terror medíocre. Siga-me Twitter, LinkedIn e me mande algumas idéias / feedback via o email.

Mais de thred.

Opinião – FKA Twigs prova que a IA pode capacitar artistas

Crédito: Wikimedia Commons

Mídia

Opinião – FKA Twigs prova que a IA pode capacitar artistas

A cantora propôs uma versão de IA de si mesma para equilibrar sua carga de trabalho. A resposta foi mista, mas Twigs acena para um futuro fortalecedor. FKA Twigs é conhecido por confundir a criatividade com tecnologia. A sua música etérea, filmes e números de dança – juntamente com empreendimentos artísticos e de moda – sempre ultrapassaram os limites e consolidaram a sua posição na cultura popular. Apesar de alcançar níveis globais de fama, Twigs nunca a abandonou...

By Flo Bellinger Brighton, UK

Explicando a ascensão do turismo do sono

Crédito: Unsplash

offbeat

Explicando a ascensão do turismo do sono

Tornando-se rapidamente uma das maiores tendências na indústria do bem-estar, cada vez mais viajantes estão abrindo mão de itinerários repletos de atividades em favor de menus de travesseiros e de dormir cedo. Um feriado pode significar muitas coisas; para alguns, envolve exploração, aventura e experimentação da culinária local. Para outros, é uma oportunidade de sentar e relaxar, de não fazer nada além de relaxar à beira da piscina por uma semana ou duas antes...

By Sofia Phillips Londres, Reino Unido

Crédito: Thred

Mídia

O uso não divulgado de IA da Netflix gera debate sobre manipulação de mídia

A Netflix foi criticada por incluir imagens não divulgadas de IA em um novo documentário sobre crimes reais. A reação gerou discussões importantes sobre a manipulação da mídia. Goste, tema ou deteste, a IA agora faz parte de nossa vida cotidiana. Da educação ao entretenimento, a inteligência artificial deverá continuar a crescer, moldando quase todos os aspectos da nossa interação com os meios de comunicação. Mas estas mudanças exigem limites. Ambas as IAs...

By Flo Bellinger Brighton, UK

‘Olho biônico’ resolve mistério do local de descanso final de Platão

Crédito: Thred

offbeat

‘Olho biônico’ resolve mistério do local de descanso final de Platão

O pesquisador italiano Graziano Ranocchia pode ter finalmente resolvido o mistério do local de descanso final de Platão. Um “olho biônico” alimentado por IA escaneou um pergaminho carbonizado de 2,000 anos escrito por volta de 348 a.C., que identificou um local específico em Atenas. O mistério de onde repousa um dos maiores filósofos do mundo pode ter acabado de ser resolvido – por uma máquina, ironicamente. O enterro de Platão, sem dúvida o mais reverenciado dos pensadores fundadores da filosofia grega...

By Jamie Watts Londres, Reino Unido

Lumiere do Google gera vídeos realistas de IA a partir de prompts de texto

O vídeo AI está mudando rapidamente de um vale misterioso para genuinamente realista, e o Lumiere do Google é o gerador de texto para vídeo mais sofisticado que já vimos até agora.

O ‘AMIE’ do Google abre caminho para a medicina baseada em IA

Funcionários do Google supostamente chamam Bard de 'pior do que inútil'

‘Olho biônico’ resolve mistério do local de descanso final de Platão

Mais de thred.

Opinião – FKA Twigs prova que a IA pode capacitar artistas

‘Olho biônico’ resolve mistério do local de descanso final de Platão

O vídeo AI está mudando rapidamente de um vale misterioso para genuinamente realista, e o Lumiere do Google é o gerador de texto para vídeo mais sofisticado que já vimos até agora.

Artigos relacionados

O ‘AMIE’ do Google abre caminho para a medicina baseada em IA

Funcionários do Google supostamente chamam Bard de 'pior do que inútil'

Popular

‘Olho biônico’ resolve mistério do local de descanso final de Platão

A natureza tornou-se oficialmente uma musicista

O uso não divulgado de IA da Netflix gera debate sobre manipulação de mídia

Acompanhe o thred inscrevendo-se no nosso boletim informativo para o planeta positivo!

Mais de thred.

Opinião – FKA Twigs prova que a IA pode capacitar artistas

Explicando a ascensão do turismo do sono

O uso não divulgado de IA da Netflix gera debate sobre manipulação de mídia

‘Olho biônico’ resolve mistério do local de descanso final de Platão