Новый AI DALL-E 2 создает изображения из текстовых подсказок

Культура
Проект
Опубликовано: 14 апреля, 2022

Кредит: OpenAI

By Чарли Кумбс

Лондон, Великобритания

2 энергетика - Удалить энергию

комментарии 0

Новая система искусственного интеллекта может создавать разнообразные изображения, как реалистичные, так и сюрреалистические, из описаний на естественном языке. У него есть потенциал, чтобы изменить правила игры, но не без некоторых опасений.

Алгоритмы и искусственный интеллект продолжают волновать индустрию искусства.

Последний прорыв произошел от исследовательской группы OpenAI, которая только что представила новую версию своей программы DALL-E. Это программное обеспечение представляет собой инструмент для преобразования текста в изображение, который создает иллюстрацию на основе введенного пользователем описания.

Посмотреть этот пост на Instagram

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Этот новый ИИ, удачно названный DALL-E 2, не будет доступен для широкой публики, но исследователи могут зарегистрироваться, чтобы ознакомиться с его возможностями. OpenAI заявляет, что в конечном итоге планирует сделать свое программное обеспечение доступным для использования в сторонних приложениях, но не сообщает, когда это произойдет.

На данный момент программа будет протестирована проверенными партнерами.

Пользователям не разрешается загружать сгенерированные изображения, которые могут «причинить вред», и они должны раскрывать, для чего они используют ИИ.

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

Как работает ДАЛЛ-Е 2?

Хотя я ни в коем случае не эксперт по кодированию, я может убедитесь, что DALL-E 2 работает с использованием встроенной библиотеки изображений. Алгоритму дается множество помеченных изображений, а затем он создает новые изображения на основе того, что он уже знает.

Допустим, вы хотели создать изображение тигра на каноэ. Странно, да? Но DALL-E 2 будет искать в своих файлах, чтобы найти, как выглядят «каноэ» и «тигр», и создать единое произведение, которое убедительно сочетает в себе оба.

Посмотреть этот пост на Instagram

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

DALL-E 2 основан на CLIP первой версии, системе компьютерного зрения. OpenAI говорит, что это новое программное обеспечение генерирует изображения, используя «рассеивание», при котором фрагмент начинается с нескольких точек и постепенно заполняется деталями.

Этот процесс происходит по двухэтапной модели. CLIP сначала сопоставляет ваш текст с другими существующими фотографиями и изображениями, затем «декодер» генерирует само изображение.

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

Вышеприведенное видео дает краткую демонстрацию того, что возможно, демонстрируя кошек, созданных искусственным интеллектом, реалистично отредактированные версии ранее существовавших изображений и сложную систему маркировки объектов, которая позволяет DALL-E 2 понимать ваши подсказки. Это действительно впечатляющие вещи.

Интересно, что OpenAI подчеркивает, что все еще есть ошибки и проблемы, которые нужно сгладить.

Посмотреть этот пост на Instagram

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Неправильно маркированные объекты могут привести к тому, что алгоритм создаст неправильные изображения, которые не совпадают с предоставленным текстовым описанием. Если в его коде есть ранее существовавшая фотография автомобиля, помеченного, например, как «самолет», то это может полностью сбить генератор с курса, отправив обратно BMW вместо Boeing.

Кроме того, очень конкретные подсказки невозможны, пока ИИ не пометит и не узнает, что представляют собой соответствующие объекты.

Запрос города или редких видов животных может привести к шатким, неправильным изображениям, пока алгоритм не будет улучшен. Имейте в виду, что это всего лишь вторая версия DALL-E, поэтому в будущем мы, без сомнения, увидим еще больше умопомрачительных демонстраций.

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

OpenAI's new model DALL·E 2 is amazing! (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

Почему это может вызвать проблемы у художников?

После просмотра художественного произведения, созданного DALL-E 2, трудно не почувствовать восторг от возможностей этой технологии.

Однако мы должны помнить о возможных подводных камнях. Художникам уже очень трудно зарабатывать деньги за свою работу в эпоху Интернета — отсюда и первоначальная причина для NFT — и новый инструмент для работы с изображениями на основе алгоритмов может вывести из бизнеса многих мелких цифровых иллюстраторов.

Посмотреть этот пост на Instagram

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Также станет намного сложнее проверить подлинность изображения или картины в Интернете, и это может обесценить работу настоящих людей. Мгновенная чеканка изображений может стать возможностью, создав еще более эксплуататорский рынок NFT.

Если каждый может сделать что-нибудь мгновенно, не потеряют ли иллюстрации и картины всю свою коммерческую ценность? Становится ли само искусство просто еще одним приложением или инструментом, который может использовать кто угодно?

Посмотреть этот пост на Instagram

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Есть большие, экзистенциальные вопросы о последствиях такого действительно новаторского программного обеспечения, на многие из которых у нас нет ответов.

К чести OpenAI, кажется очень хорошо осведомлен об опасностях. В нем говорится, что DALL-E 2 никогда не будет полностью доступен для публики, а будет медленно распространяться среди доверенных исследователей и партнеров на основе отзывов. Пользователям нужно будет сказать, почему они используют программное обеспечение и не могут создавать изображения непристойного или вредного характера.

Он хочет убедиться, что дезинформация или фальсифицированные изображения не приведут к дальнейшему хаосу в наших политических системах и онлайн-дискурсе.

Посмотреть этот пост на Instagram

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Эти намерения могут быть достаточно разумными, но кто сказал, что другие, менее благонамеренные программисты не будут просто копировать работу OpenAI? Мы уже видели запуск одного приложения под названием Wombo's Dream в прошлом году, явно основанного на этой концепции.

Вы можете получить к нему доступ прямо сейчас — хотя он гораздо менее сложный, чем DALL-E 2.

В конечном счете, мы понятия не имеем, как эта технология может повлиять на мир искусства. Что мы сделалиo знаю, что вещи становятся пугающе впечатляющими, возможно, даже немного сверхъестественной долиной. На данный момент OpenAI, похоже, ответственно внедряет свои продукты — и это лучшее, на что мы можем надеяться на этом раннем этапе.

Чарли Кумбс

Главный редактор Лондон, Великобритания

Я Чарли (Он/Он), главный редактор Thred. Я изучал английский язык в Бирмингемском университете и, будучи энтузиастом музыки и игр, помешан на поп-культуре. Вы можете увидеть, как я курирую плейлисты, разрабатываю изображения для заголовков статей и потягиваю сидр по четвергам. Следуй за мной на Twitter, LinkedIn и напишите мне несколько идей / отзывов через e-mail.

Больше от thred.

«Бионический глаз» разгадает тайну места последнего упокоения Платона

Кредит: Тред

непривычный

«Бионический глаз» разгадает тайну места последнего упокоения Платона

Итальянский исследователь Грациано Раноккья, возможно, наконец-то разгадал тайну места последнего упокоения Платона. «Бионический глаз» с искусственным интеллектом просканировал карбонизированный свиток возрастом 2,000 лет, написанный около 348 г. до н.э., и определил конкретное место в Афинах. Тайна того, где покоится один из величайших философов мира, возможно, только что была раскрыта – по иронии судьбы, с помощью машины. Похороны Платона, возможно, самого почитаемого из основоположников греческой философии...

By Джейми Уоттс Лондон, Великобритания

Кредит: Pexels

Медиа

Природа официально стала музыкантом

В рамках новой кампании природа была признана артистом на крупнейших потоковых платформах, включая Spotify. Роялти пойдут на поддержку инициатив по борьбе с изменением климата по всему миру. Температура повышается, среда обитания сокращается, а ледники тают с беспрецедентной скоростью. По мере изменения климата страдания Земли продолжают достигать новых высот, и реальность того, что у нас заканчивается время, чтобы что-то с этим сделать, становится...

By София Филлипс Лондон, Великобритания

Что такое «взрослые годы перерыва» и почему их количество растет?

Кредит: Unsplash

непривычный

Что такое «взрослые годы перерыва» и почему их количество растет?

Чаще всего это обряд посвящения для подростков и людей в возрасте от 20 лет, откладывание всего, чтобы путешествовать по миру, быстро становится тенденцией среди старшего поколения, ищущего перерыва от безжалостной природы жизни во взрослом возрасте. Год перерыва, который обычно ассоциируется с порогом взрослой жизни, — это период развития для тех, у кого есть время и ресурсы для путешествий, волонтерства и т. д.

By София Филлипс Лондон, Великобритания

Что такое «теория мертвого Интернета» и реальна ли она?

Кредит: Тред

непривычный

Что такое «теория мертвого Интернета» и реальна ли она?

С непрерывным развитием искусственного интеллекта с 2022 года заговоры вокруг так называемой «теории мертвого Интернета» стали сильнее. Но прежде всего, что это, черт возьми, и есть ли к этому какое-то доверие? Стоит ли заблудиться в этой онлайн-кроличьей норе? Это чистая буря в чашке чая? Эту статью вообще человек написал? Так много вопросов. Если вы проводите значительное количество времени в Твиттере (X)…

By Джейми Уоттс Лондон, Великобритания