Google Lumiere генерирует реалистичные видео с искусственным интеллектом из текстовых подсказок

Культура
Проект
Отправлено: 30 января, 2024

Кредит: Google Люмьер

By Джейми Уоттс

Лондон, Великобритания

1 энергетика + Добавить энергию

комментарии 0

Видео с использованием искусственного интеллекта быстро превращается из жуткой долины в по-настоящему реалистичное, а Google Lumiere — самый совершенный генератор преобразования текста в видео, который мы когда-либо видели.

Вызвав чувство трепета – и изрядную дозу беспокойства – Google недавно продемонстрировал, насколько сложным стало видео с искусственным интеллектом всего за несколько лет разработки.

Точно так же, как генераторы текста в изображение, такие как Bing Image Creator, DALL-E и Midjourney, могут создавать оригинальные изображения из однострочной подсказки, GoogleЛюмьерПриложение может превратить наши самые смелые идеи в полностью визуализированные пятисекундные видеоролики.

Разумеется, другие примеры генераторов текста в видео уже доступны, но попытка Google является первой попыткой действительно добиться точного изображения движения, близкого к стандарту CGI.

Это достигается за счет создания базовой рамы и использования широко разрекламированной STUNet (Space-Time-U-Net) технология, позволяющая автономно определять, где и как должны двигаться объекты на изображении. После выбора объекты в этом начальном кадре состоят из нескольких собственных слоев, которые плавно перетекают друг в друга.

https://youtu.be/wxLr02Dz2Sc

Lumiere способен генерировать 80 кадров на изображение по сравнению с предыдущим максимумом в 25, достигнутым его ближайшим конкурентом Stable Video Diffusion. Хотя некоторые ранние результаты, опубликованные Google, имеют оттенок искусственности, скачок в общем качестве с момента их публикации Демоверсия 2022 ошеломляет.

Помимо преобразования текста в видео, существует также генерация изображения в видео, которая оживляет неподвижное изображение, генерация стилизации, которая может создавать видео в определенном визуальном стиле, и настройка кинематографа, позволяющая анимировать определенную часть видео. существующий образ – например, текущая вода, мерцающий огонь или дым из локомотива поезда.

С точки зрения рыночной стратегии, позднее появление Люмьера соответствует модно поздней политике Google. С момента появления первой версии инструмента генеративного языка Бард провалился В прошлом году технологический гигант незаметно разработал свое мультимодальное видение генеративного искусственного интеллекта.

https://youtu.be/jV1vkHv4zq8

Google's newest and most capable AI | Gemini (https://youtu.be/jV1vkHv4zq8)

Его последнее объявление последовало за демонстрацией языковой модели Gemini от Google, которая, как ожидается, бросит вызов ChatGPT за звание эталона для сектора.

Если выйти за рамки коммерческого ажиотажа вокруг искусственного интеллекта в видео, было бы упущением игнорировать потенциальную возможность злоупотребления этой технологией, поскольку становится все труднее отличить художественные произведения от контента из реальной жизни.

Продолжающийся разгром, связанный с откровенно сексуальными изображениями Тэйлор Свифт и ее подобие использования приложений для преобразования текста в изображение может быть лишь верхушкой айсберга, если преобразование текста в видео будет иметь такой же масштаб.

Google уверяет, что создает гарантии для обеспечения добросовестного использования Lumiere, но авторы документа не уточнили, как именно будут предотвращаться инциденты. Мы очень хотим заполучить эту технологию, но только если она откроет большую банку с червями.

Джейми Уоттс

Технический редактор Лондон, Великобритания

Я Джейми (он/он), заместитель редактора и старший писатель Thred. Моя сильная сторона — следить за обновлениями в социальных сетях и революционными технологиями, но, когда я буду вдали от клавиатуры, вы, вероятно, обнаружите, что я окутан большим ледяным взрывом Tango в последнем посредственном фильме ужасов. Следуй за мной на Twitter, LinkedIn и напишите мне несколько идей / отзывов через Эл. адрес.

Больше от thred.

Мнение – FKA Twigs доказывает, что искусственный интеллект может расширить возможности художников

Предоставлено: Wikimedia Commons.

Медиа

Мнение – FKA Twigs доказывает, что искусственный интеллект может расширить возможности художников

Певица предложила версию себя с искусственным интеллектом, чтобы сбалансировать свою рабочую нагрузку. Реакция была неоднозначной, но Твигс кивает в сторону расширения возможностей будущего. Известно, что FKA Twigs размывает творческий потенциал с помощью technology. Ее неземная музыка, фильмы и танцевальные номера – наряду с искусством и модой – всегда расширяли границы и укрепляли ее позиции в популярной культуре. Несмотря на то, что Твигс достигла мирового уровня известности, она никогда не отказывалась от своей...

By Фло Беллинджер Брайтон, Великобритания

Кредит: Unsplash

непривычный

Объясняем рост ночного туризма

Быстро становясь одной из крупнейших тенденций в велнес-индустрии, все больше и больше путешественников отказываются от маршрутов, насыщенных мероприятиями, в пользу меню подушек и раннего сна. Праздник может быть разным; для некоторых это включает в себя исследования, приключения и дегустацию местной кухни. Для других это возможность расслабиться и ничего не делать, а просто полежать у бассейна неделю или две, прежде чем...

By София Филлипс Лондон, Великобритания

Нераскрытое использование искусственного интеллекта Netflix вызывает дебаты о манипулировании СМИ

Кредит: Тред

Медиа

Нераскрытое использование искусственного интеллекта Netflix вызывает дебаты о манипулировании СМИ

Netflix подвергся критике за включение нераскрытых изображений искусственного интеллекта в новый документальный фильм о реальных преступлениях. Негативная реакция вызвала важные дискуссии о манипулировании СМИ. Нравится ли вам он, бойтесь его или ненавидите, ИИ теперь стал частью нашей повседневной жизни. От образования до развлечений, искусственный интеллект будет только расти, формируя почти все аспекты нашего взаимодействия со средствами массовой информации. Но эти изменения требуют границ. Оба ИИ...

By Фло Беллинджер Брайтон, Великобритания

«Бионический глаз» разгадает тайну места последнего упокоения Платона

Кредит: Тред

непривычный

«Бионический глаз» разгадает тайну места последнего упокоения Платона

Итальянский исследователь Грациано Раноккья, возможно, наконец-то разгадал тайну места последнего упокоения Платона. «Бионический глаз» с искусственным интеллектом просканировал карбонизированный свиток возрастом 2,000 лет, написанный около 348 г. до н.э., и определил конкретное место в Афинах. Тайна того, где покоится один из величайших философов мира, возможно, только что была раскрыта – по иронии судьбы, с помощью машины. Похороны Платона, возможно, самого почитаемого из основоположников греческой философии...

By Джейми Уоттс Лондон, Великобритания

Google Lumiere генерирует реалистичные видео с искусственным интеллектом из текстовых подсказок

AMIE от Google прокладывает путь к медицине, основанной на искусственном интеллекте

Сообщается, что сотрудники Google называют Барда «хуже, чем бесполезным»

Мнение – FKA Twigs доказывает, что искусственный интеллект может расширить возможности художников

«Бионический глаз» разгадает тайну места последнего упокоения Платона

Больше от thred.

Мнение – FKA Twigs доказывает, что искусственный интеллект может расширить возможности художников

«Бионический глаз» разгадает тайну места последнего упокоения Платона

Статьи по теме

AMIE от Google прокладывает путь к медицине, основанной на искусственном интеллекте

Сообщается, что сотрудники Google называют Барда «хуже, чем бесполезным»

Популярное

Мнение – FKA Twigs доказывает, что искусственный интеллект может расширить возможности художников

«Бионический глаз» разгадает тайну места последнего упокоения Платона

Природа официально стала музыкантом

Будьте в курсе событий, подписавшись на нашу новостную рассылку, положительно влияющую на планету!

Больше от thred.

Мнение – FKA Twigs доказывает, что искусственный интеллект может расширить возможности художников

Объясняем рост ночного туризма

Нераскрытое использование искусственного интеллекта Netflix вызывает дебаты о манипулировании СМИ

«Бионический глаз» разгадает тайну места последнего упокоения Платона