Dalí + Wall-E = Dall-E

13 de Gener de 2022
Josep Maria Ganyet | VIA Empresa

El professor XavierFerràsescrivia diumenge a La Vanguardia un article amb el títol de Només som dades. Partint del generador d’imatges Dall-E, capaç de crear imatges a partir de descripcions en text, argumentava que en realitat no funciona de manera tan diferent al nostre cervell: “El geni creatiu sorgeix de l’associació d’idees, de la connexió de trossos d’informació emmagatzemats en algun lloc de la ment. (…) No és això també el que fan les màquines? Buscar a la xarxa, a la velocitat de la llum, trossos dispersos d’informació i connectar-los en composicions gràfiques o literàries úniques?”

L’article acaba preguntant-se si això és realment així, si en realitat el cervell humà i internet són equiparables, en termes de simulació: si internet és el “bessó digital” del cervell (nota etimològica: el nom de Dall-E és la suma de Dalí i Wall-E, el robot protagonista de la pel·lícula homònima de Píxar).

El generador d’imatges Dall-E impressiona molt. Li podeu demanar que dibuixi coses tan estrafolàries com una ravenet amb tutú passejant un gos o un ordinador dels anys 1920… o un del futur. El resultat és tan impactant com desconcertant; una màquina és capaç de generar allò que li demanem: objectes quotidians, espais, i fins i tot objectes que mai no han existit però que respecten els cànons estètics del seu moment històric (feu la prova amb els ordinadors de cada dècada).

El Wall-E, basat en el model de llenguatge GPT-3, en el camp dels referents ens guanya per golejada: té tot el contingut de la web al cap

En aquest sentit el Dall-E treballa com ho faria un humà. He utilitzat abans el verb “demanar” de manera deliberada perquè l’encàrrec que li fem és purament textual; escrivim allò que ens cal tal i com ho faríem en un full d’encàrrec a un il·lustrador (no en digueu briefing, si us plau). Una vegada comprès l’encàrrec, el Wall-E és capaç d’establir relacions entre trossos dispersos d’informació i crear-ne de nova, tal i com ho fem els humans. Provem-ho. Pareu un moment de llegir i penseu en un cotxe del futur.

Amb tota seguretat heu pensat en un vehicle per a quatre ocupants, que és capaç de volar però que no té ales i que circula per l’atmosfera terrestre. El coneixement que teniu del món —el coneixement d’un objecte quotidià com el cotxe, les pel·lícules retrofuturistes que heu vist al llarg de la vostra vida i la literatura de ciència ficció— us n’ha condicionat el resultat. Si us hagués demanat de pensar en una nau del futur, amb tota seguretat us haurien vingut al cap les de la guerra de les galàxies en un fons negre amb estels. El Wall-E, basat en el model de llenguatge GPT-3, en el camp dels referents ens guanya per golejada: té tot el contingut de la web al cap, inclosos llibres, publicacions, articles acadèmics, viquipèdies i més (això sí, el contingut que hi havia fins al 2019, que és quan va acabar el seu aprenentatge).

A partir d’aquí només li cal treballar, computar en termes cibernètics. Si la primera capacitat del cervell és la de la memòria —emmagatzematge i recuperació de coneixement—, la segona és la capacitat de crear nou coneixement; o de computar. Sabem que la matèria organitzada d’una manera determinada és capaç d'emmagatzemar informació —penseu en un àbac o en el vostre matalàs— i que organitzada de manera més complexa és capaç de processar informació per obtenir-ne de nova —l’ordinador que teniu a davant, el mòbil o el GPT3. També sabem que si la matèria encara s’organitza de manera més complexa, és capaç de generar consciència, i aquí només en tenim un exemple: el cervell. De moment, que se sàpiga, el GPT-3 encara no ha generat consciència, però tot podria ser que entretenir-nos amb dibuixets personalitzats sigui el primer pas per a dominar el món.