Menú Menú

¿Por qué el generador de texto de IA de Elon Musk es tan espeluznante?

¿Por qué nadie habla de lo oscura que es la salida del nuevo bot generador de texto de OpenAI?

El mundo ha tenido casi un mes para jugar con las sistema de inteligencia artificial generadora de texto desarrollado por el laboratorio de investigación afiliado a Elon Musk, OpenAI. Y jugar tenemos.

La tecnología, que aparentemente fue creada por el laboratorio para promover las capacidades de la Inteligencia General Artificial, diseña textos en lenguaje natural basados ​​en información humana: genera palabras, construye oraciones y sigue patrones de lenguaje. Aliméntelo con un titular falso, por ejemplo, y escribirá una noticia; dale la primera línea de un poema y te proporcionará un verso completo.

Aquí se han suministrado las dos primeras líneas de TS Eliot La tierra baldía (aportación humana en negrita):

 

Abril es el mes más cruel, la cría
Lilas de la tierra muerta, mezclando
 los corazones de
Niños como comenzaba la primavera del ciclo.
Toda mi vida he construido una fortaleza en mi corazón
Por el inframundo, por el santuario ancestral.
En el sueño he descubierto los secretos más profundos,
De los reinos legendarios, de los siniestros castillos.
Y quisiera conocer la gnosis de mi especie,
Y si pudiera quedarme contigo para siempre
Otra vez hay noches que son largas y aterradoras

 

Esencialmente, intenta hacer que su salida sea indistinguible del texto escrito por un humano. Aunque, un humano muy perturbado que vive en una cabaña de troncos y se mueve a la luz de las velas (pero llegaremos a eso más adelante).

GPT-2, porque todos los buenos robots necesitan nombres, ha estado dando vueltas por la oficina de OpenAI desde hace un tiempo. La compañía anunció su existencia en febrero y, aunque el modelo parecía prometedor, encontró cierta resistencia. Los grupos de derechos humanos, en particular, manifestaron su preocupación por el potencial de la tecnología para convertirse en un generador de propaganda extremista. ¿Por qué escribir spam de reclutamiento de supremacistas blancos en 8chan cuando su propia versión de Wall-E puede hacerlo por usted?

OpenAI respondió a esta protesta, afirmando que no estaría disponible para el público debido a "preocupaciones sobre aplicaciones maliciosas de la tecnología". Sin embargo, esto no duró mucho.

En lugar de lanzar el modelo completamente entrenado a principios de año, lanzó una versión más pequeña en intervalos. Luego, a principios de noviembre, OpenAI siguió adelante y publicó todo en línea de todos modos, porque ¿por qué diablos no? O, más bien, porque, como dice, "no se han visto pruebas sólidas de uso indebido hasta ahora".

El hecho de que el 'hasta ahora' en la cita anterior resuena con una especie de malicia amenazante (imagínese que el Sr.Burns se ríe en una silla giratoria durante una Simpson Especial de Halloween) es bastante conmovedor a la luz de los resultados que muchos usuarios han obtenido después de usar GPT-2. El resultado del modelo no solo es inquietantemente convincente, sino que también suele ser inquietante en general.

Vea algunos de los resultados que obtuve esta mañana después de enviar indicaciones completamente inocentes:

 

Tan pronto como entró en la habitación supo que estaba ocupada y por quién. La pared exterior estaba llena de las mismas formas ásperas y la madera oscura familiar que antes, solo que ahora Elliot tenía la misma edad, buena postura, y estaba de pie con la barbilla pegada al pecho, un enfermizo aire amarillo verdoso de mala salud y soledad. resonando desde sus facciones pálidas y lejanas. Parte del Muro se había volcado ...

 

Emma sabía que esto era lo más feliz que se podía sentir.

“Le hemos dado otra oportunidad”, dijo su padre. “Él es nuestro hijo. Hemos gastado algo de dinero, así que es como nuestro hijo otra vez ".

David llegaba a la escuela antes de su turno diurno y, a menudo, recogía a su hija del trabajo.

Durante un tiempo, solo hablaron y se reirían. Y luego, en la noche del 26 de octubre de 2012, llamó David.

“Hay algo mal en la casa”, dijo. “Simplemente no hay nada malo en la casa ...

Para ser justos con el bot, existe la posibilidad de que mis referencias vagamente melancólicas en el primer fragmento a habitaciones oscuras y formas amorfas sugirieran que la IA continúa de una manera gótica, pero, lo siento, el sentimiento más feliz no conduce a hay algo mal en la casa. Eso es solo un golpe.

Eché un vistazo a mi alrededor para ver si alguien más se había encontrado con el mismo problema: finales extrañamente oscuros y desconcertantes para lo que se suponía que era una sugerencia alegre. Mientras que la mayoría parecía centrarse en la controversia detrás de la tecnología y las posibles implicaciones para el futuro si la IA y su disponibilidad continúan siendo reguladas por empresas privadas en lugar del gobierno, descubrí que Mike Pearl de The Outline fue igualmente preocupado por la pura angustia que GPT-2 estaba produciendo.

Lo que él llama el 'sesgo espeluznante' de la IA en realidad tiene una respuesta sencilla, aunque todavía me alegro de no haber sido el único al que le molestó un poco. En pocas palabras, GPT-2 es espeluznante porque lo somos. El sistema se entrenó utilizando ocho millones de documentos de texto extraídos de la loca World Wide Web, lo que significa que este pobre robot fue sometido no solo a todos los artículos de Wikipedia que se hayan escrito sobre Jake Paul, sino también a los fan fiction de Rick y Morty. Puedo ver por qué está más que un poco perturbado.

Como afirma OpenAI, 'los modelos de lenguaje tienen sesgos. Descubrir cómo estudiar estos sesgos, discutirlos y abordarlos es un desafío para la comunidad de investigación de IA '. El sesgo hacia la locura, entonces, es solo uno de los rasgos humanos no humanos que fueron entrenados en GPT-2 debido a los millones de páginas de locura que insistimos en publicar en Internet.

Así que ahí lo tienes. Dale a un robot una muestra de las creaciones literarias de la humanidad y reflejará una sociedad llena de sexpots espeluznantes y obsesionados por fanfics con inclinaciones por lo horripilante. Es bueno saberlo, supongo.

Accesibilidad