Ens pot ajudar la IA a ser més creatius? (I)

01 de Desembre de 2022
Josep Maria Ganyet | VIA Empresa

La intel·ligència artificial (IA) era una cosa del futur que s’ha convertit en el present de cop. Ho recordarem sempre perquè el futur va arribar en tornar de vacances d’estiu, l’agost del 2022.

Sabíem de sistemes que a partir d’un text eren capaços de crear imatges, d’altres que a partir de temes musicals en podien generar de molt semblants i d’altres que eren capaços de generar textos que semblaven redactats per humans. Tots generaven a parts iguals admiració, estupefacció i moltes preguntes, la més important era de si allò era realment creatiu.

Els que havíem seguit una mica el tema recordem haver llegit en articles científics publicats un llunyà 2016 com els ordinadors eren capaços de descriure el que hi havia en una imatge i de manera simètrica generar una imatge a partir d’un text. També recordem la imaginació que hi havíem de posar per veure un “elefant volant en un cel rosa” en una imatge que com a màxim feia 32x32 píxels. Però el salt era qualitatiu: per primera vegada a la història qualsevol persona podia crear imatges noves, per surrealistes que fossin, només escrivint un text (“una pintura a l’estil Mona Lisa amb una cabra mirant un iPad”). La barrera que imposaven els programes de generació d’imatges (Photoshop, Illustrator, Cinema 4D, etc.) començava a caure.

També sabíem com el model de llenguatge GPT-3, la intel·ligència artificial darrere el Dall-E 2, podia també generar textos indistingibles dels que generaria un humà. Plataformes com Sudowrite, Bloom o la catalana Fermat permeten generar textos coherents de manera automàtica a partir d’unes quantes paraules.

També hem vist com el projecte Deep Bach de Sony produïa corals a l’estil de Bach, una eina d’aprenentatge profund per a la generació automàtica de música. DeepBach, després d’haver escoltat totes les corals de Bach va ser capaç d’escriure’n 80 més, que a les oïdes dels neòfits (i no tant) són indistingibles de les del mestre.

“Cotorres estocàstiques”

Alguns acadèmics són molt escèptics amb aquestes tecnologies. L’argument és que si tot el que fan és generar contingut nou a partir de patrons que han extret de les dades de les que han après, els resultats no es poden considerar del tot originals i molt menys creatius. Ha fet fortuna el nom de “cotorres estocàstiques” de la professora de la Universitat de Washington Emily Bender al que també s’apunta el nostrat expert en IA Ramon López de Màntaras.

Seguint amb aquest raonament sembla que la creativitat acabarà minvant i tot el que farem seran mashups de la cultura que ens ha precedit: la nostra espècie ja no donarà cap més Shakespeare, Bach, Rembrandt, Lennon i McCartney o Jay Z.

Passarà realment així? Respondre a la pregunta de si els ordinadors ens ajudaran a ser més creatius o tot el contrari és complicat, tant que us podria donar arguments prou convincents en un sentit o un altre.

Primer, perquè no tenim una definició clara de què és intel·ligència artificial, de fet, no la tenim ni d’intel·ligència! Qui era més intel·ligent, Newton o Einstein? Einstein o Picasso? Picasso o Jay Z? En general definim intel·ligència artificial com la capacitat de les màquines d’assolir competències equiparables a les dels humans, com les de reconeixement de patrons, d’aprenentatge o d’inferència. Observeu, però, que en certa manera utilitzem la paraula intel·ligència per definir-la del moment en que ens referim a humans (a qui en principi hauríem de considerar intel·ligents).

"Consideràvem que jugar a escacs era el pinacle de la intel·ligència fins que el 1997 el Deep Blue d’IBM va guanyar el Gary Kasparov"

Definir què és un comportament humà intel·ligent a banda de ser molt complicat, canvia amb el temps. Consideràvem que jugar a escacs era el pinacle de la intel·ligència fins que el 1997 el Deep Blue d’IBM va guanyar el Gary Kasparov. Llavors el jugar a escacs va passar a ser una competència que requeria concentració, mètode, estratègia, planificació i visió, que si ho podia fer una màquina potser no requeria tanta intel·ligència.

La definició que més m’agrada d’intel·ligència artificial (i per extensió d’intel·ligència) és la de Larry Tessler, un enginyer que als anys 70 havia treballat al Xerox Parc i després a Apple, Amazon i Yahoo. És aquella que diu que: “Intel·ligència artificial és tot allò que no s’ha fet”. La cita fa al·lusió al fet que quan una cosa la saben fer els ordinadors considerem que deixa de ser intel·ligent. Una altra versió en el mateix sentit que és encara més clara és la que diu: “intel·ligència és tot allò que els ordenadors no saben fer”.

La definició d’intel·ligència artificial de Larry Tessler: “És tot allò que no s’ha fet” perquè, quan una cosa la saben fer els ordinadors, considerem que deixa de ser intel·ligent

Tampoc no tenim una definició clara de creativitat. Si no podem ordenar Newton, Einstein i Picasso per intel·ligència tampoc no ho podem fer per creativitat. Qui va ser més creatiu? Newton a l’hora de descobrir les lleis del moviment, Einstein per ajuntar l’espai i el temps, o Picasso per deconstruir-los?

I els ordinadors? En poden ser? On posem els sistemes basats en IA del Dall-E 2, del Midjourney o de l’Stable Diffusion? És clar que depèn de que entenguem per creativitat, que com passa amb la intel·ligència fa de mal definir. Precisament era Picasso que deia que els ordinadors eren molt avorrits, que només sabien donar respostes, que allò interessant era fer les preguntes.

Però això era abans de les vacances d’estiu del 2022. Avui, cada imatge generada, cada text, cada peça musical, és una pregunta que ens interpel·la directament: cada plataforma és una capsa de Pandora per obrir. La primera pregunta és: tot el que hem vist i sentit és resultat de la creativitat o és fruit de la repetició d’una cotorra estocàstica?

I si és fruit de la creativitat, qui és el creatiu? El programador? L’artista creador de l’estil que la IA intenta imitar? El creador del text que li dóna a l’algorisme el seu objectiu? Els milions de persones autores dels textos, les imatges i els àudios de les quals ha après la xarxa neuronal? Tothom?

Per respondre a això ens caldrà definir el que és creativitat d’una manera més formal, sabent que depèn del substrat cultural i que a la seva base hi ha la còpia, la transformació i la combinació, tasques totes en les que els ordinadors excel·leixen.

Poso aquesta primera part de l’article al Fermat i la setmana que ve ho rematem amb el que em generi.