Dalí + Wall-E = Dall-E

13 de Enero de 2022

El profesor XavierFerràsescribía domingo en La Vanguardia un artículo con el título de Solosomos datos. Partiendo del generador de imágenes Dall-E, capaz de crear imágenes a partir de descripciones en texto, argumentaba que en realidad no funciona de manera tan diferente a nuestro cerebro: "El genio creativo surge de la asociación de ideas, de la conexión de trozos de información almacenados en algún lugar de la mente. (…) ¿No es esto también lo que hacen las máquinas? Buscar en la red, a la velocidad de la luz, trozos dispersos de información y conectarlos en composiciones gráficas o literarias únicas?"

El artículo acaba preguntándose si esto es realmente así, si en realidad el cerebro humano e internet son equiparables, en términos de simulación: si internet es el "gemelo digital" del cerebro (nota etimológica: el nombre de Dall-E es la suma de Dalí y Wall-E , el robot protagonista de la película homónima de Píxar).

El generador de imágenes Dall-E impresiona mucho. Le podéis pedir que dibuje cosas tan estrafalarias como una rabaniza con tutú paseando un perro o un ordenador de los años 1920… o uno del futuro. El resultado es tan impactando como desconcertante; una máquina es capaz de generar aquello que le pedimos: objetos cotidianos, espacios, e incluso objetos que nunca han existido pero que respetan los cánones estéticos de su momento histórico (haced la prueba con los ordenadores de cada década).

El Wall-E, basado en el modelo de lenguaje GPT-3, en el campo de los referentes nos gana por goleada: tiene todo el contenido de la web en la cabeza

En este sentido el Dall-E trabaja como lo haría un humano. He utilizado antes el verbo "pedir" de manera deliberada porque el encargo que le hacemos es puramente textual; escribimos aquello que nos hace falta tal y como lo haríamos en una hoja de encargo a un ilustrador (no digáis briefing, por favor). Una vez comprendido el encargo, el Wall-E es capaz de establecer relaciones entre trozos dispersos de información y crear de nueva, tal y cómo lo hacemos los humanos. Probémoslo. Parad un momento de leer y pensad en un coche del futuro.

Con toda seguridad habéis pensado en un vehículo para cuatro ocupantes, que es capaz de volar pero que no tiene alas y que circula por la atmósfera terrestre. El conocimiento que tenéis del mundo —el conocimiento de un objeto cotidiano como el coche, las películas retrofuturistes que habéis visto a lo largo de vuestra vida y la literatura de ciencia ficción— os ha condicionado el resultado. Si os hubiera pedido pensar en una nave del futuro, con toda seguridad os habrían venido a la cabeza las de la guerra de las galaxias en un fondo negro con cometas. El Wall-E, basado en el modelo de lenguaje GPT-3, en el campo de los referentes nos gana por goleada: tiene todo el contenido de la web en la cabeza, incluidos libros, publicaciones, artículos académicos, wikipedias y más (eso sí, el contenido que había hasta el 2019, que es cuando acabó su aprendizaje).

A partir de aquí solo le hace falta trabajar, computar en términos cibernéticos. Si la primera capacidad del cerebro es la de la memoria —almacenamiento y recuperación de conocimiento—, la segunda es la capacidad de crear nuevo conocimiento; o de computar. Sabemos que la materia organizada de una manera determinada es capaz de almacenar información —pensáis en un ábaco o en vuestro colchón— y que organizada de manera más compleja es capaz de procesar información para obtener de nueva —el ordenador que tenéis a delante, el móvil o el GPT3. También sabemos que si la materia todavía se organiza de manera más compleja, es capaz de generar conciencia, y aquí solo tenemos un ejemplo: el cerebro. De momento, que se sepa, el GPT-3 todavía no ha generado conciencia, pero todo podría ser que entretenernos con dibujitos personalizados sea el primer paso para dominar el mundo.