El nuevo AI DALL-E 2 crea imágenes a partir de mensajes de texto

Cultura
Diseño
Publicado 14 abril, 2022

Crédito: Open AI

By charlie coombs

Londres, Reino Unido

2 energía - Eliminar energía

0 comentarios

Un nuevo sistema de inteligencia artificial puede crear una variedad de imágenes tanto realistas como surrealistas a partir de descripciones en lenguaje natural. Tiene el potencial de cambiar el juego, pero no sin algunas preocupaciones.

Los algoritmos y la IA continúan haciendo olas en la industria del arte.

El último avance proviene de un equipo de investigación llamado OpenAI, que acaba de presentar una nueva versión de su programa DALL-E. Este software es una herramienta de generación de texto a imagen que produce ilustraciones basadas en una descripción ingresada por el usuario.

Ver esta publicación en Instagram

Una publicación compartida por DALL·E por OpenAI (@openaidalle)

Acertadamente llamada DALL-E 2, esta nueva IA no estará disponible para el público, pero los investigadores pueden registrarse para obtener una vista previa de sus capacidades. OpenAI dice que planea hacer que su software esté disponible para su uso en aplicaciones de terceros eventualmente, aunque no se sabe cuándo sucederá.

Por ahora, el programa será probado por socios examinados.

Los usuarios no pueden cargar imágenes generadas que puedan "causar daño" y deben revelar para qué están usando la IA.

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

¿Cómo funciona DALL-E 2?

Si bien no soy de ninguna manera un experto en codificación, podemos confirme que DALL-E 2 funciona con una biblioteca de imágenes preconstruida. El algoritmo recibe una gran cantidad de imágenes etiquetadas y luego crea nuevas ilustraciones basadas en lo que ya sabe.

Digamos que desea crear una imagen de un tigre en una canoa. Extraño, ¿verdad? Pero DALL-E 2 buscará en sus archivos para encontrar el aspecto de una 'canoa' y un 'tigre', y creará una sola pieza que combine de manera convincente ambos.

Ver esta publicación en Instagram

Una publicación compartida por DALL·E por OpenAI (@openaidalle)

DALL-E 2 se basa en el CLIP de la primera iteración, un sistema de visión por computadora. OpenAI dice que este nuevo software genera imágenes usando 'difusión', por lo que una pieza comienza como unos pocos puntos y se completa gradualmente con detalles.

Este proceso ocurre a través de un modelo de dos etapas. CLIP primero compara su texto con otras fotografías e imágenes existentes, luego un 'descodificador' genera la imagen en sí.

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

El video anterior brinda una breve demostración de lo que es posible, mostrando gatos generados por IA, versiones editadas de manera realista de imágenes preexistentes y un complejo sistema de etiquetado de objetos que permite que DALL-E 2 entienda sus indicaciones. Es algo realmente impresionante.

Curiosamente, OpenAI enfatiza que todavía hay errores y problemas por resolver.

Ver esta publicación en Instagram

Una publicación compartida por DALL·E por OpenAI (@openaidalle)

Los objetos que están mal etiquetados pueden hacer que el algoritmo produzca imágenes incorrectas que no se alinean con la descripción de texto proporcionada. Si dentro de su codificación tiene una foto preexistente de un automóvil etiquetado como 'avión', por ejemplo, esto podría desviar completamente el curso del generador, enviando de vuelta un BMW en lugar de un Boeing.

Además, las indicaciones muy específicas no son posibles hasta que la IA haya etiquetado y aprendido cuáles son los objetos relevantes.

Preguntar por una ciudad o una especie rara de animal puede dar como resultado imágenes torcidas e incorrectas hasta que se mejore el algoritmo. Tenga en cuenta que esta es solo la segunda iteración de DALL-E, por lo que sin duda veremos demostraciones aún más alucinantes en el futuro.

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

OpenAI's new model DALL·E 2 is amazing! (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

¿Por qué esto podría causar problemas a los artistas?

Después de leer detenidamente la obra de arte creada por DALL-E 2, es difícil no sentirse emocionado por las posibilidades de la tecnología.

Sin embargo, debemos ser conscientes de los peligros potenciales. Los artistas ya tienen muchas dificultades para ganar dinero por su trabajo en la era de Internet, de ahí la razón inicial de las NFT, y una nueva herramienta de imagen basada en algoritmos podría dejar fuera del negocio a muchos ilustradores digitales de poca monta.

Ver esta publicación en Instagram

Una publicación compartida por DALL·E por OpenAI (@openaidalle)

También será mucho más difícil verificar la autenticidad de una imagen o pintura en línea y puede devaluar el trabajo de seres humanos genuinos. La acuñación de imágenes instantáneas podría convertirse en una posibilidad, creando un mercado NFT aún más explotador.

Si todo el mundo puede hacer cualquier cosa al instante, ¿las ilustraciones y las pinturas pierden todo su valor comercial? ¿Se convierte el arte en sí mismo simplemente en otra aplicación o herramienta para que cualquiera la use?

Ver esta publicación en Instagram

Una publicación compartida por DALL·E por OpenAI (@openaidalle)

Hay grandes preguntas existenciales en cuanto a las implicaciones de un software tan genuinamente innovador, muchas de las cuales no tenemos las respuestas.

Para crédito de OpenAI, parece muy consciente de los peligros. Dice que DALL-E 2 nunca estará completamente disponible para el público, y solo se implementará lentamente para investigadores y socios de confianza en función de los comentarios. Los usuarios deberán decir por qué están usando el software y no pueden crear imágenes que sean obscenas o dañinas.

Quiere asegurarse de que la desinformación o las imágenes falsificadas no terminen causando más estragos en nuestros sistemas políticos y también en el discurso en línea.

Ver esta publicación en Instagram

Una publicación compartida por DALL·E por OpenAI (@openaidalle)

Estas intenciones pueden ser lo suficientemente sólidas, pero ¿quién puede decir que otros codificadores con menos buenas intenciones no copiarán simplemente el trabajo de OpenAI? Ya vimos el lanzamiento de una aplicación llamada Wombo's Dream el año pasado, claramente basada en este concepto.

puedes acceder ahora – aunque es mucho menos sofisticado que DALL-E 2.

En última instancia, no tenemos idea de cómo esta tecnología podría afectar el mundo del arte. lo que hacemoso Lo que sé es que las cosas se están poniendo aterradoramente impresionantes, tal vez incluso un pequeño valle inquietante. Por ahora, OpenAI parece estar implementando sus productos de manera responsable, y eso es lo mejor que podemos esperar en esta etapa inicial.

charlie coombs

Editor en jefe Londres, Reino Unido

Soy Charlie (él/él), el editor en jefe de Thred. Estudié inglés en la Universidad de Birmingham y, como entusiasta de la música y los juegos, soy un nerd de la cultura pop. Puedes encontrarme curando listas de reproducción, diseñando imágenes de titulares de artículos y bebiendo sidra un jueves. Sígueme en Twitter, Etiqueta LinkedIn y déjame algunas ideas / comentarios a través de email.

Más de thred.

El 'ojo biónico' resuelve el misterio del lugar de descanso final de Platón

Crédito: Thred

excéntrico

El 'ojo biónico' resuelve el misterio del lugar de descanso final de Platón

Es posible que el investigador italiano Graziano Ranocchia haya resuelto finalmente el misterio del lugar de descanso final de Platón. Un "ojo biónico" impulsado por IA escaneó un pergamino carbonizado de 2,000 años de antigüedad escrito alrededor del 348 a. C. que señalaba una ubicación específica en Atenas. El misterio de dónde reposa uno de los más grandes filósofos del mundo puede haber sido resuelto recientemente (irónicamente, por una máquina). El entierro de Platón, posiblemente el más venerado de los pensadores fundacionales de la filosofía griega...

By jamie watts Londres, Reino Unido

La naturaleza se ha convertido oficialmente en músico.

Crédito: Pexels

Medios

La naturaleza se ha convertido oficialmente en músico.

Como parte de una nueva campaña, Nature ha sido reconocida como artista en las principales plataformas de streaming, incluida Spotify. Las regalías se destinarán a apoyar iniciativas de acción climática en todo el mundo. Las temperaturas están aumentando, los hábitats están disminuyendo y los glaciares se están derritiendo a un ritmo sin precedentes. A medida que el clima cambia, el sufrimiento de la Tierra continúa alcanzando nuevas alturas, y la realidad de que se nos está acabando el tiempo para hacer algo al respecto se vuelve...

By sofia phillips Londres, Reino Unido

¿Qué son los "años sabáticos en la edad adulta" y por qué van en aumento?

Crédito: Unsplash

excéntrico

¿Qué son los "años sabáticos en la edad adulta" y por qué van en aumento?

Por lo general, un rito de iniciación preuniversitario para adolescentes y personas de poco más de 20 años, dejar todo en suspenso para viajar por el mundo se está convirtiendo rápidamente en una tendencia entre las generaciones mayores que buscan un descanso de la naturaleza implacable de la vida de adultos. Normalmente asociado con el borde de la edad adulta, un año sabático es un período de desarrollo para quienes tienen el tiempo y los recursos para viajar, ser voluntarios,...

By sofia phillips Londres, Reino Unido

¿Qué es la 'Teoría de Internet muerta' y es real?

Crédito: Thred

excéntrico

¿Qué es la 'Teoría de Internet muerta' y es real?

Con el incesante crecimiento de la IA desde 2022, las conspiraciones en torno a la llamada 'Teoría de Internet muerta' se han fortalecido. Pero lo primero es lo primero: ¿qué diablos es? ¿Tiene credibilidad? ¿Vale la pena perderse en esta madriguera de conejos en línea? ¿Es pura tormenta en una taza de té? ¿Un humano siquiera escribió este artículo? Muchas preguntas. Si pasas una cantidad significativa de tiempo en Twitter (X)...

By jamie watts Londres, Reino Unido