Меню Меню

Новый AI DALL-E 2 создает изображения из текстовых подсказок

Новая система искусственного интеллекта может создавать разнообразные изображения, как реалистичные, так и сюрреалистические, из описаний на естественном языке. У него есть потенциал, чтобы изменить правила игры, но не без некоторых опасений.

Алгоритмы и искусственный интеллект продолжают волновать индустрию искусства.

Последний прорыв произошел от исследовательской группы OpenAI, которая только что представила новую версию своей программы DALL-E. Это программное обеспечение представляет собой инструмент для преобразования текста в изображение, который создает иллюстрацию на основе введенного пользователем описания.

 

Посмотреть этот пост на Instagram

 

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Этот новый ИИ, удачно названный DALL-E 2, не будет доступен для широкой публики, но исследователи могут зарегистрироваться, чтобы ознакомиться с его возможностями. OpenAI заявляет, что в конечном итоге планирует сделать свое программное обеспечение доступным для использования в сторонних приложениях, но не сообщает, когда это произойдет.

На данный момент программа будет протестирована проверенными партнерами.

Пользователям не разрешается загружать сгенерированные изображения, которые могут «причинить вред», и они должны раскрывать, для чего они используют ИИ.


Как работает ДАЛЛ-Е 2?

Хотя я ни в коем случае не эксперт по кодированию, я может убедитесь, что DALL-E 2 работает с использованием встроенной библиотеки изображений. Алгоритму дается множество помеченных изображений, а затем он создает новые изображения на основе того, что он уже знает.

Допустим, вы хотели создать изображение тигра на каноэ. Странно, да? Но DALL-E 2 будет искать в своих файлах, чтобы найти, как выглядят «каноэ» и «тигр», и создать единое произведение, которое убедительно сочетает в себе оба.

 

Посмотреть этот пост на Instagram

 

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

DALL-E 2 основан на CLIP первой версии, системе компьютерного зрения. OpenAI говорит, что это новое программное обеспечение генерирует изображения, используя «рассеивание», при котором фрагмент начинается с нескольких точек и постепенно заполняется деталями.

Этот процесс происходит по двухэтапной модели. CLIP сначала сопоставляет ваш текст с другими существующими фотографиями и изображениями, затем «декодер» генерирует само изображение.

Вышеприведенное видео дает краткую демонстрацию того, что возможно, демонстрируя кошек, созданных искусственным интеллектом, реалистично отредактированные версии ранее существовавших изображений и сложную систему маркировки объектов, которая позволяет DALL-E 2 понимать ваши подсказки. Это действительно впечатляющие вещи.

Интересно, что OpenAI подчеркивает, что все еще есть ошибки и проблемы, которые нужно сгладить.

 

Посмотреть этот пост на Instagram

 

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Неправильно маркированные объекты могут привести к тому, что алгоритм создаст неправильные изображения, которые не совпадают с предоставленным текстовым описанием. Если в его коде есть ранее существовавшая фотография автомобиля, помеченного, например, как «самолет», то это может полностью сбить генератор с курса, отправив обратно BMW вместо Boeing.

Кроме того, очень конкретные подсказки невозможны, пока ИИ не пометит и не узнает, что представляют собой соответствующие объекты.

Запрос города или редких видов животных может привести к шатким, неправильным изображениям, пока алгоритм не будет улучшен. Имейте в виду, что это всего лишь вторая версия DALL-E, поэтому в будущем мы, без сомнения, увидим еще больше умопомрачительных демонстраций.


Почему это может вызвать проблемы у художников?

После просмотра художественного произведения, созданного DALL-E 2, трудно не почувствовать восторг от возможностей этой технологии.

Однако мы должны помнить о возможных подводных камнях. Художникам уже очень трудно зарабатывать деньги за свою работу в эпоху Интернета — отсюда и первоначальная причина для NFT — и новый инструмент для работы с изображениями на основе алгоритмов может вывести из бизнеса многих мелких цифровых иллюстраторов.

 

Посмотреть этот пост на Instagram

 

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Также станет намного сложнее проверить подлинность изображения или картины в Интернете, и это может обесценить работу настоящих людей. Мгновенная чеканка изображений может стать возможностью, создав еще более эксплуататорский рынок NFT.

Если каждый может сделать что-нибудь мгновенно, не потеряют ли иллюстрации и картины всю свою коммерческую ценность? Становится ли само искусство просто еще одним приложением или инструментом, который может использовать кто угодно?

 

Посмотреть этот пост на Instagram

 

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Есть большие, экзистенциальные вопросы о последствиях такого действительно новаторского программного обеспечения, на многие из которых у нас нет ответов.

К чести OpenAI, кажется очень хорошо осведомлен об опасностях. В нем говорится, что DALL-E 2 никогда не будет полностью доступен для публики, а будет медленно распространяться среди доверенных исследователей и партнеров на основе отзывов. Пользователям нужно будет сказать, почему они используют программное обеспечение и не могут создавать изображения непристойного или вредного характера.

Он хочет убедиться, что дезинформация или фальсифицированные изображения не приведут к дальнейшему хаосу в наших политических системах и онлайн-дискурсе.

 

Посмотреть этот пост на Instagram

 

Пост, опубликованный DALL·E by OpenAI (@openaidalle)

Эти намерения могут быть достаточно разумными, но кто сказал, что другие, менее благонамеренные программисты не будут просто копировать работу OpenAI? Мы уже видели запуск одного приложения под названием Wombo's Dream в прошлом году, явно основанного на этой концепции.

Вы можете получить к нему доступ прямо сейчас — хотя он гораздо менее сложный, чем DALL-E 2.

В конечном счете, мы понятия не имеем, как эта технология может повлиять на мир искусства. Что мы сделалиo знаю, что вещи становятся пугающе впечатляющими, возможно, даже немного сверхъестественной долиной. На данный момент OpenAI, похоже, ответственно внедряет свои продукты — и это лучшее, на что мы можем надеяться на этом раннем этапе.

Универсальный доступ