• Innovació
  • Conversa amb el Professor Sala i Martín sobre Intel·ligència Artificial

Conversa amb el Professor Sala i Martín sobre Intel·ligència Artificial

"Ni serà l'apocalipsi, ni serà el paradís on el robot anirà a treballar per nosaltres, li donarem un petonet al matí i tornarà la nit amb el salari"

Xavier Sala i Martín presenta el llibre 'Entre el Paradís i l’Apocalipsi: l’economia de la intel·ligència artificial'. | Marc Llibre
Xavier Sala i Martín presenta el llibre 'Entre el Paradís i l’Apocalipsi: l’economia de la intel·ligència artificial'. | Marc Llibre
Josep Maria Ganyet | VIA Empresa
Etnògraf digital
Barcelona
19 d'Abril de 2025

Transcripció de la conversa que vaig tenir amb el Professor Xavier Sala i Martín el dilluns 14 d’abril de 2025 a les oficines de Penguin Random House a Barcelona amb motiu de la publicació del seu darrer llibre 'Entre el Paradís i l’Apocalipsi: l’economia de la intel·ligència artificial'.

 

Per què costa tant explicar què és la intel·ligència artificial? O per què costa tant posar-nos d’acord en una definició?

  • Jo crec que el problema que hi ha és la interferència de Hollywood que fa que la gent imagini una cosa que no és, que tothom imagini el Jarvis de l'Iron Man i que quan parlem d'intel·ligència artificial, de seguida fem la projecció i llavors se'ns presenten aquests dos mons: el paradís i l'apocalipsi.
  • Si és el Jarvis, curarà totes les malalties i resoldrà la pobresa i el canvi climàtic.
  • O es convertirà en el Terminator i perseguirà humans. I jo crec que una gran part del debat ve del fet que no s'entén. Estic parlant del debat popular, eh?

Sí, sí, sí…

 
  • Òbviament els experts saben el que és. Però, fins i tot entre els experts, jo crec que hi ha el debat aquest del perill existencial, no? Que hi ha grans savis que s'apunten a aquestes tesis.
  • Jo crec que fins i tot això està intoxicat per Hollywood, per la imatge que tindrem una superintel·ligència. I pel llibre del... com es diu, del suec, del... 

…del Bostrom…

  • …del Nick Bostrom, que, en el moment en què arribis a la IAG (IA general), doncs immediadament després ja ve la súperintel·ligència. I per tant ja hem de començar a preocupar-nos pel... 
  • Jo crec que una gran part del problema és aquest. Jo, per mi, la definició d'intel·ligència, ja sé que no és la teva… la teva definició és la de… 

…la de Stuart Russell (1)…

  • Sí, exacte.
  • Jo soc més de François Chollet, saps? La intel·ligència és la capacitat o la facilitat amb la que tu soluciones problemes que no has vist mai.

És molt bona aquesta definició. Els problemes ja venen del fet que no tenim una definició consensuada de què és intel·ligència. A partir d’aquí, si hi afegeixes artificial a la darrera, la cosa encara es complica més.

  • I el problema de la intel·ligència artificial general és que l’hem definida com allò que una màquina pot fer igual o millor que els humans en un ampli espectre de coses, no?
  • Jo crec que el que estem fent, no sé com dibuixar-ho, però si els humans, si tenim una gràfica del que fan els humans [dibuixa amb els dits una corba en forma de pujol], i aquesta és la frontera del que podem fer, la intel·ligència artificial no farà això [dibuixa una aproximació al perfil pujol], sinó que farà això [dibuixa una corba que puja i baixa travessant el perfil de pujol].
  • És a dir, hi haurà coses, els escacs i el no sé què, que ho farà molt millor, però amb altres seguirà estant per sota. Llavors, clar, en quin moment pots dir que és superior? En algunes coses ja ho és i en moltes altres coses segueix molt per sota de la frontera.
  • O sigui, no és que vagi creixent així i així [dibuixa una exponencial a l’aire] i arribarà un moment que anirem cap allà, sinó que anirem travessant la frontera per diferents àrees; i cada vegada n'hi ha més.

Sí, això jo sempre ho visualitzo en forma de te majúscula, o sigui, tenim moltes intel·ligències artificials específiques que verticalment ens superen: els escacs, escriure textos… escriuen molt millor que la mitjana, aquests generadors… intel·ligències que són molt bones en un àmbit, però molt dolentes en la resta.

I, en canvi, nosaltres som raonablement dolents en molts àmbits, o raonablement bons.

Llavors, i jo crec que també ve d'aquí aquesta confusió, és que es confon aquesta intel·ligència artificial estreta o específica —i ara m'agradaria que ens ho expliquessis— amb la general.

  • Sí, la intel·ligència específica vol dir que la màquina pot fer una tasca, sigui jugar a escacs, sigui llegir, sigui el que sigui.
 L'etnògraf Josep M. Ganyet i l'economista Xavier Sala i Martín | Marc Llibre
L'enginyer Josep M. Ganyet i l'economista Xavier Sala i Martín | Marc Llibre

El Breakout (2) famós.

  • Exacte, jugar al Breakout… a nivells superhumans.
  • I això ja ho fa; des dels anys 20, des de l'ENIAC als 40 que les màquines ja van molt més ràpid que els humans a fer càlculs. 
  • I per tant, el que passa és que la intel·ligència aquesta, tal com la dissenyem… la nostra intel·ligència segurament ve de la comprensió. Nosaltres fem textos, pensem, tenim el concepte, sabem el que volem dir, entenem el problema…

…tenim uns objectius…

  • …i llavors ho traduïm en text. Ells ho fan, la màquina ho fa, a base de predir paraules sense tenir aquesta comprensió. 
  • Però tenir aquesta comprensió és el que permet exportar el coneixement a d’altres àmbits. El Garry Kasparov (3) no només sap jugar a escacs, sinó que és capaç d'utilitzar l'estratègia dels escacs per estratègia política o empresarial. 
  • I com que el procés d'aprenentatge és diferent, nosaltres aprenem el concepte, nosaltres comprenem —la comprensió—, i la màquina no, doncs ella no pot exportar, i per tant té una intel·ligència molt narrow, molt estreta, molt...

…sí, específica. narrow, estreta està molt bé, perquè és molt gràfic, n’explica molt bé les limitacions. El que passa que aquí ho adaptem a “específica” tot i que jo també en dic sovint “estreta”…

  • …i llavors, clar, la gran lluita que estan tenint és intentar exportar, és intentar fer que les màquines puguin fer el mateix que els humans.
  • El que passa és que ho estem intentant de la manera equivocada. No ho estem fent a través de la comprensió. La màquina no entén l'entorn físic de la manera que l’entens tu. I tu l'entens perquè tens un cos físic i perquè des de petit tiraves el got d'aigua i queia a terra, i has anat aprenent una sèrie de coses que no pots explicar, que no estan escrites a internet…

…i que no m'ha explicat ningú…

  • …que no t'ha explicat ningú però que tu les has anat aprenent segurament perquè tens un cos, cosa que la màquina no té. I tens uns sentits: el sentit del tacte, de la vista que la màquina no té.
  • I per tant, com que el procés d'aprenentatge —el procés pel qual arribem a jugar a escacs o a escriure— és diferent, doncs la màquina no pot canviar. I si sap jugar a escacs no saps fer res més.
  • Però no només això. O sigui, hi ha hagut aquests experiments que al Breakout li treus dues línies de píxels i la màquina no sap jugar. Has de tornar a entrenar des de zero, 50 milions de partides, perquè ha estat entrenada amb, no sé, 500 per 500 píxels; enlloc de de 500 n’hi fots 498 i ja s’ha perdut…

…és un altre joc per ella quan per tu seria el mateix…

  • …nosaltres ens podem adaptar. Nosaltres juguem a tennis, ens donen una pista un metre més curta i podem jugar igualment. Segurament fallarem cops però podem jugar sense haver d'aprendre des de zero. La màquina no. A la màquina li fots una pista un metre més curta i ja no sap jugar; si li fots un joc d'escacs sense cavalls, doncs no sap jugar; li fots un joc d'escacs que li canvies el quadre negre pel quadre blanc, gires el taulell…
  • I això és el debat que hi ha, no?… de si arribarem a la intel·ligència general aquesta —que no sé ben bé què vol dir— amb aquest gràfic en què en tots els àmbits, diguem, la màquina sigui superior als humans: no crec que passi, sinó que passarà que cada vegada dominarà més branques, però per arribar a la capacitat aquesta d'exportar coneixements d'un domini cap a un altre, jo crec que haurem d'abandonar els LLMs, els models de llenguatge.
  • No es farà a través de fer models més grossos i més grossos i més grossos. Caldran altres coses, com la capacitat de raonar, com la capacitat de planificar, com la capacitat d'entendre l'entorn físic, les lleis de la natura que ningú t'ha explicat però que tu, sense saber-ho, entens… el sentit comú.
¿Cuáles son las dos formas de llegar a la IA? ¿Imitando la mente o imitando el cerebro? | Marc Llibre
Quines són les dues maneres d’arribar a la IA? Imitant la ment o imitant el cervell? | Marc Llibre

La capacitat de manipular símbols com manipulem nosaltres. Això, tots aquests proponents de les lleis de l'escala, és a dir, més potència de càlcul, més dades, més paràmetres...

  • …més calés…

…més calés… però hi ha gent com el Gary Marcus, que amb el seu article famós de fa 3 anys (4), ja va dir que hi ha un mur. Que ens hi podem aproximar molt, però com que no hi ha corbes exponencials en general —les corbes d'innovació són en forma d’essa— potser estem arribant a aquest mur. 

Si ho donem per bo, no n'hi hauria prou amb la intel·ligència artificial basada en l'aprenentatge màquina —amb mètodes predictius— i caldria recuperar la IA simbòlica.

Voldria que ens parlessis també d'aquestes dues aproximacions; dues escoles que són gairebé irreconciliables que s'han odiat a mort tots aquests anys i que jo crec —molts creiem— que estan condemnades a tornar-se a trobar i a entendre’s.

Parlem una mica de les dues maneres d’arribar a la IA: imitant la ment o imitant el cervell.

  • Exacte. Des del principi dels temps, que no sé si el principi és l'any 56 amb la conferència de Dartmouth (5) o era abans amb el Walter Pitts (6) o no ho sé, però des del principi dels temps hi ha hagut els que intentaven replicar la intel·ligència a base de replicar la ment i els que intentaven replicar el cervell.
  • Els connexionistes intenten simular d'una manera molt primitiva i mecànica les neurones. Bàsicament, a les neurones hi ha un cos central, després hi ha les dendrites, que és per on entra la informació, i hi ha l'axó, que és el que es connecta amb les altres neurones.
  • Llavors, la simulació és: entren dades, i si arriba —com passa al nostre cervell—, si arriba a una cosa que es diu un potencial mínim, llavors dispara i passa la informació a la neurona següent.

La neurona és un processador d’informació.

  • I llavors dius, doncs això ho podem fer matemàticament, no? Hi posem números, si aquest número és més gran que no sé què, pam, dispares, no?
  • Això pot... aquesta idea que ja ve de Walter Pitts dels anys 40, doncs ha anat evolucionant des d'una neurona, després a un Perceptró (7), fins a un conjunt de neurones, que són les xarxes neuronals.
  • I posades de diferents maneres, fins a l'última, diguem-ne versió, que seria la moderna, que serien els Transformers (8). Que és bàsicament el mateix, però posat d'una manera molt sofisticada.

Que no deixa de ser un procés artesanal, d'assaig i error, del què funciona i no funciona.

  • Exactament, que molt sovint diuen, no, no, que deixem, la màquina sola aprèn. No, la màquina sola aprèn, no. Quan no aprèn, va un humà, canvia per aquí, canvia per allà. Per tant, la màquina no aprèn sola.
  • Però, diguem, un via ha sigut allò d'intentar replicar la idea que el cervell humà és també una màquina i, per tant, si és una màquina que executa un algoritme, podem replicar-ho.
  • Llavors, de manera natural, emergirà la intel·ligència. De la manera que, de manera natural, en nosaltres no sabem com, ningú ho entén, però a base de neurones connectant-se amb els neurotransmissors cap aquí i cap allà, de manera natural, doncs, emergeix el sentit comú i la capacitat de raonar... 

…i la consciència…

  • …i fins i tot la consciència. Està per demostrar que es pugui aconseguir, però és la teoria, no? Aquesta és la via.
  • L'altra via és dir, escolta, no cal anar al detall, no sabem ben bé com ho fotem, però som capaços de raonar i d'aplicar la lògica aristotèlica. Doncs agafem això i intentem simular-ho, sense anar al nivell de neurona, anem a un nivell superior… comencem ja. 
  • La primera via, com que intenta replicar neurones i les seves connexions s'anomena connexionisme o xarxes neuronals —hi ha diferents noms—, i la segona, com que nosaltres per aplicar aquesta lògica fem servir símbols —números, paraules, operacions—, el que fem és començar d'aquí, i d’això se n’anomena intel·ligència artificial simbòlica.
  • Al començament, a la conferència de Dartmouth hi havia de tot, tots eren tot, perquè no hi havia dues escoles que es barallaven. Però de seguida, com sempre passa en el món acadèmic, que tothom intenta escombrar cap a casa; doncs si jo tinc raó vol dir que tu ets dolent, i si tu tens raó vol dir que jo soc dolent, i a poc a poc es van anar separant fins a arribar a...
  • O sigui, que uns deien que els altres no eren intel·ligència artificial real, sinó que ells són la intel·ligència artificial, els altres no. I en el món acadèmic hi ha coses que… fas una conferència i no convides els altres. 
  • O en el món acadèmic, quan tu publiques, hi ha uns àrbitres anònims que decideixen si l'article és bo o és dolent, doncs clar... si et passen un article de l'altre camp, doncs el mates perquè no publiqui, i a la teva revista no deixes publicar els altres, i es crea una guerra absurda i comú; això passa a tots els àmbits de la ciència, a l'economia també ens passa, els keynesians i els clàssics es maten. I això ha passat.
  • Però perquè ens entenguem, el que ha tingut èxit en els darrers anys, des de l'any 2012, tant en el món de la percepció —de la identificació d'imatges—, com en el món de la predicció —les eines que fa servir Google per fer els anuncis— com en l'àmbit de l'escriptura, han sigut els neuronals, els connexionistes.
  • Els altres han quedat una mica enrere, tot i que semblava que serien els que guanyarien, i que els tontos eren els connexionistes, ara sembla que... 
  • Però com bé dius, hi va haver un gran progrés, no? GPT-1, GPT-2, GPT-3, GPT-4, i llavors van fer la projecció exponencial, però… sembla que s’han encallat.
  • I no només s'han encallat els GPT —OpenAI—, sinó que s’han encallat els de Google, que tots bàsicament fan el mateix —fan Transformers— i tenen un producte que per més dades que els posis, més paràmetres, més sofisticació, bàsicament segueix fent el mateix, hi ha millores marginals…
  • I ara que hi ha el que el Gary Marcus anomena el Hitting the wall, que la resta del món en diem rendiments decreixents, doncs ara diuen: és hora d'unir els dos camps.

Jo crec que és inevitable. De fet els èxits de DeepMind —l’AlphaGo, l’AlphaZero i el que guanya el Nobel, l’AlphaFold (9)—…

  • … el Demis Hassabis…

…ja són una barreja de les dues.

Parles del 2012. Què passa el 2012? Per què hi ha aquesta explosió? Quines causes porten al famós AlexNet? (10) I les conseqüències, que estem veient ara?

  • El 2012 es fa públic... la gent veu que les xarxes neuronals finalment poden ser útils. Les xarxes neuronals no són noves.
    Comencen amb Walter Pitts i amb el Perceptró. Van tenir un problema tècnic, el de la Backpropagation (11), que es va solucionar als anys 70. Després va haver-hi una implementació de Yann LeCun.
Durant els anys vuitanta, ja es programaven xarxes neuronals | Marc Llibre
Durant els anys vuitanta, ja es programaven xarxes neuronals | Marc Llibre

Estem parlant dels anys 40, i dels anys 50, 60, 70 i 80, eh?

  • Però tenia dos grans problemes. Un era la capacitat. Bàsicament el que fa aquesta tecnologia és agafar moltes, moltes dades —processar molts números, moltes matrius de números—, i clar, primera, necessites moltes dades; i segona, per processar moltes dades necessites poder computacional.
  • I als anys 80 tot això eren teories matemàtiques que les teníem i dèiem, mira, pot funcionar; el teorema diu que això convergirà i tal pim pam, però no es podia implementar perquè no teníem ni els ordinadors ni les dades.
  • Llavors, al 89 arriba el model de Yann LeCun, que era de visió i que va ser un dels grans primers èxits comercials perquè detectava números: el van comprar els serveis de correus, els bancs per llegir xecs…
  • Quan tu vas al caixer automàtic i poses un xec, la màquina en llegeix els números —números escrits a mà, perquè tu al xec has posat 485 euros— i la màquina ho entén. Tot això són les xarxes neuronals dels anys 80 del Yann LeCun.
  • Però no detectava coses sofisticades; podia llegir números, però poca cosa més. Llavors li ensenyaves una foto d'un gat i no tenia ni idea que era un gat, perquè necessitaves moltes fotos de gats i necessitaves processadors gegants; una foto d'un gat, té milions de píxels.
  • Llavors, en aquest procés —des del 89, des del Yann LeCun fins al 2012— passen dues coses.
  • Primera, la Fei-Fei Li es dedica a anar a internet i agafar milions de fotos i etiquetar-les; això és un gat, això és un gos, això és un T-Rex, que és una feina brutal.
  • I la segona cosa és que els ordinadors, amb la llei de Moore van millorant la seva capacitat computacional. També els videojocs fan que millorin els processadors gràfics…

…les GPUs…

  • …sí, que són paral·leles, perquè per fer gràfics necessites fer moltes coses, no gaire sofisticades, però moltes alhora, i per fer això, és el mateix.

Són matrius, multiplicacions de matrius.

  • I llavors dius… l’any 2010-2011 la gent comença a dir: i si en lloc de CPUs fem servir GPUs? I un dels que ho va fer va ser l’Alex Krzyzewski, que estudiava amb el Hinton, un dels que es va inventar— el Backpropagation i tal i qual. 
  • És a dir, que la idea estava per allà flotant i aquest paio diu —no ha fet res nou, eh?—: agafem les dades de la Fei-Fei Li, agafem els processadors paral·lels d’NVIDIA, agafem la teoria del Hinton i del Yann LeCun i tot això. Ho posa junt, i pam, de sobte les màquines comencen a veure-hi i a identificar imatges…

…comencen a ser útils…

  • …i llavors va guanyar el campionat, perquè la Fei-Fei Li va fer una altra cosa xula: va fer un campionat d’ordinadors aviam qui hi veia millor. I la primera xarxa neuronal (que es diu convolucional) que va ser capaç d'identificar va ser aquesta, l’AlexNet, que va destruir la tecnologia anterior que eren els Support Vector Machines, i llavors a partir d'aquí... 
  • Però clar, si t'hi fixes, això és una màquina de fer prediccions, és a dir, és una màquina d'agafar píxels, i predir l'etiqueta associada; si hi ha un error: bruum, Backpropagation, canviem els paràmetres, i hi tornem. Una altra foto, un altre pixel, i anar fent.
  • I llavors, clar, dius, és una màquina de fer prediccions; aquí prediu etiquetes, però podries predir els gustos dels consumidors de Google, pots fer molts tipus de prediccions, i aquí comença la revolució de la intel·ligència artificial predictiva. 
  • El tret de sortida és la visió, però s’aplica a molts d'altres àmbits sense que ens n’adonem. Els anuncis de Google és bàsicament el mateix; prediuen que aquest paio està buscant un Audi i pam, li fotrem un anunci d'Audi, perquè n’hem fet la predicció.
  • És una cosa més complicada, perquè hi ha tot el tema de la semàntica i de posar les paraules en l'espai de significats, que això comença amb el Yoshua Bengio i tot això, i l'Oriol Vinyals (12) de Sabadell.
  • Però al final arriben els Transformers, que és una manera sofisticada de fer tot això, de predir paraules, però segueixen sent algoritmes de predicció estadística: prediuen paraules.
  • I arribem a ChatGPT que és l’altre gran moment. Si el 2012, diguem, les notícies arriben als experts —les xarxes neuronals és the way to go—, al 2022 arriben al gran públic.

I això és definitiu. De fet, va arribar el 2016 quan Google canvia la tecnologia del seu traductor per la de les xarxes neuronals, però no ho vam veure.

  • …l’Oriol Vinyals, amb l’Ilya Sutskever (13) i un enginyer vietnamita que no en recordo el nom.

Quan canvia, clar, no ens n'adonem ni sabem el perquè, però notem que d'un dia per l'altre, de sobte, el traductor de Google funciona millor i que comença a ser útil.

  • Jo me'n recordo d'haver vist el salt: de sobte les traduccions comencen a funcionar.

Sí, perquè al llibre expliques que tu et traduïes els teus articles de La Vanguardia, perquè primer els enviaves en català i la traducció al castellà era un desastre.

  • Tenien un programa que es deia Bendit, que no sé com funcionava.

Al principi a mi també me’l traduïen. No sé quina tecnologia hi havia a sota, però jo havia llegit algunes traduccions del castellà on deia el contrari del que havia escrit en català. 

Ara m’ho faig jo, amb el traductor de SoftCatalà o amb el Google Translate. 

  • És veritat hi ha un canvi al 2016, però tens raó, és un canvi que el notes però no ho saps; que no és “mira aquí hi ha una nova tecnologia com el ChatGPT que pam!”

Llavors ho veus com una cosa normal: un traductor ha de traduir bé, no fotem. 

  • Jo suposo que la gent no entén la dificultat, dius “per què ho fa tot tan malament? Amb com n’és de fàcil, no?” Perquè nosaltres podem traduir amb tota facilitat i en canvi no enteníem perquè a les màquines els costava tant.
  • I per tant, el xoc era, com de malament ho feia, i de sobte passa a ser normal, clar, coi, que et traduís en català, castellà, coi…. 

…si ho fa la canalla!

  • Clar, però sí que és veritat que aquest xoc, va ser el principi, diguem-ne, de la revolució de la IA generativa. 

Llavors arriba aquest gran moment, el 2022, quan això arriba al gran públic. És clar, et posen aquesta tecnologia, la tecnologia digital més avançada que hem desenvolupat mai, en una interfície que tots sabem fer servir, que és un xat; ho sap fer servir la canalla de 5 anys i els avis de 95.

  • Per als experts com tu —jo t'havia sentit a la ràdio parlant del GPT-2 i el GPT-3 i tal— els savis, els que esteu en el tema ja sabíeu que això estava passant.
  • Però el gran públic no se n'adona perquè era complicat per la interfície, no? “D’acord, d’acord, ho vull provar que ha sortit el Ganyet a la ràdio i ha dit que hi ha una màquina que escriu”. Però quan tu intentaves, hòstia... Això és molt difícil.

I puc anar més enrere, eh? Quan érem a l'Autònoma, que hi vam coincidir als vuitanta, ja programàvem xarxes neuronals, això de reconèixer els caràcters. 

Però clar, amb una matriu de, no ho sé, de 5 per 5. I feies una a majúscula i llavors l’hi treies un bastonet; encara reconeixia una a; n’hi treies un altre i la interpretava com una hac. Era màgic, però la màgia s’acabava quan t’adonaves que era un exercici per aprovar les pràctiques. I això desapareix fins que en tornem a parlar el 2012.

Llavors, ui ui, coreu-hi tots, que resulta que allò era útil. I canvia tot amb l’arribada de ChatGPT, que és també un fenomen cultural. M’agradaria que m’expliquessis una mica l'impacte, més enllà de la tecnologia; l'impacte social, l'impacte econòmic, i que fem una mica d’això que tan poc t'agrada, que és de veure cap a on anem.

  • Sí, a veure, jo crec que té un impacte psicològic o sociopsicològic importantíssim, perquè de sobte veiem que no som l'única entitat a l'univers, que és capaç d’escriure. 
  • I com que el nostre cervell associa escriure bé o comunicar-se bé a través del llenguatge sofisticat amb la intel·ligència, de sobte ens ve al cap el Jarvis i el C3PO i el no sé què, no? I el Terminator.
  • Per què? Doncs perquè el nostre cervell ens enganya i ens diu... és allò de la pareidòlia que ens fa humanitzar-ho o antropomorfitzar-ho tot. Perquè fins ara érem els únics. I de sobte li atorguem unes capacitats cognitives de consciència, una intel·ligència que no té.
  • Però clar que ens deixa al·lucinats. Dius, de sobte hi ha entitats que poden escriure millor que nosaltres. Llavors comencem a fer prediccions catastròfiques: “tots els que escriuen perdran la feina, tots els que... fins ara raonaven, perdran la feina!”. I comencem a fer prediccions catastrofistes. El mateix Hinton: “tots els que ara es dedicaven a mirar, com els radiòlegs, aquests perdran la feina”. 
  • El 2016 Hinton diu que al cap de 5 anys no quedarà ni un radiòleg. Som el 25, hi ha més radiòlegs que mai. Però a tots ens ve aquesta sensació, fins i tot als més savis. Aquest senyor té el Premi Nobel, el Premi Turing, té tots els premis del món, i s'equivoca amb les prediccions. Però és un xoc veure que de sobte tenim competència en l'únic àmbit en què érem únics, que era la intel·ligència.
  • I això té implicacions, o sigui, les empreses es desperten i totes miren com poder retallar costos, no? Podem fotre fora la secretària o el becari o no sé què, és a dir, que tothom reacciona; gent que reacciona de manera equivocada.
  • Gent que el fa servir de psicòleg: “ningú no m'entén, la màquina m'entén”. I com que és una conversa… això també és un problema psicològic nostre que ja havia passat als 60 amb l'ELIZA (14) que feia servir el truco de l’almendruco de repetir la pregunta amb la resposta i repetir la resposta amb la pregunta. I la gent es pensava que era super llesta: tenim la tendència a voler humanitzar-ho tot.
  • I això tindrà conseqüències perilloses. Ja les ha tingut. Gent que se suïcida, de gent que confia en la màquina, és a dir, que hi ha una revolució psicològica i sociològica a la vegada, que tindrà conseqüències econòmiques.
  • Jo, de fet, en el llibre intento emfasitzar que una gran part del problema som nosaltres, el tenim aquí [s’assenyala el front]. Som nosaltres que som els crèduls. Som nosaltres els que hauríem d'entendre, distingir les fake news de les no fake news.
    Som nosaltres els que hauríem d’adonar-nos que el cotxe funciona el 99% del les vegades bé, però que hi ha un de cada cent que no anirà bé.

Un cotxe de conducció autònoma.

  • Un cotxe de conducció autònoma. I que quan la intel·ligència artificial et recomana medicines, doncs que una de cada deu se la inventarà.

Volia comentar el títol del llibre: Entre el Paradís i l’Apocalipsi. Casualment lliga amb un parell de llibres que he trobat per aquí a l’editorial, que són el Brave New World de Huxley i el Compte de la Serventa de la Margaret Atwood. 

Veient el que passa aquests dies als Estats Units, cada vegada el Compte de la Serventa em sembla més un llibre costumista; aviat semblarà un documental.

La IA ens convertirà en una classe inútil, que no servirà per a res absolutament, o ens portarà a una Arcàdia feliç?

Avui mateix he vist un vídeo en què preguntaven al Hinton: “escolti, tot aquest superàvit i aquests grans beneficis que portarà la intel·ligència artificial, com ho podem fer perquè beneficiïn a tothom?” 

“Socialisme”, respon Hinton, lacònic.

Serem capaços de repartir la riquesa que generi la IA? O senzillament acabarem amb un d'aquells escenaris que diu el Max Tegmark, que la intel·ligència artificial serà tan benèvola que ens guardarà en una mena de reserva índia o en un zoo per a què les generacions futures vegin com era la humanitat?

  • De fet els lectors no sé si saben que aquest llibre va començar amb una conversa amb tu després dels dos ser testimonis d'una conferència apocalíptica del Yuval Harari a Davos, on presentava la part negativa: els seus humans inútils, la classe inútil etc.
  • I jo crec que això va en contra de tota l'evolució de la història. Però no hi ha una llei econòmica, no hi ha un teorema que digui que sempre que es destrueix feina se'n crea més; és una evidència empírica com la llei de Moore, però…
 Serem capaços de repartir la riquesa que generi la IA? | Marc Llibre
Serem capaços de repartir la riquesa que generi la IA? | Marc Llibre

…no és una llei de la natura…

  • …no és una llei de la natura, i per tant és possible el que diu el Harari. Podria ser. 
  • Però jo no tinc ni idea d'intel·ligència artificial, i tu i jo vam anar a menjar pizza i et vaig dir, escolta, explica'm això de la intel·ligència artificial. I tu vas ser el primer que em va explicar els dos camps els simbòlics, els connexionistes i tot això. Em vas recomanar uns llibres i allà va començar tot, ara fa set anys a Davos, el 2018.
  • I per tant aquest llibre neix amb la voluntat d'entendre
    aquest escenari catastrofista, si era possible o no. Després me’n vaig adonar, a mida que vaig anar llegint, perquè he llegit muntanyes i muntanyes de llibres…

…jo crec que ho has llegit tot. Vaig mirar la bibliografia del primer i ara he mirat la del segon, i dic: no pot ser que des d’aquell dia de la pizza hagi llegit tot això, és increïble!

  • Han passat set anys, eh? Es poden llegir molts llibres. 

Sí, sí, i t'has posat a estudiar un màster a Harvard, eh?

  • Sí perquè vaig veure que hi ha la visió apocalíptica i també la contrària: els Kurzweil i els Diamandis i tal, que parlen de la superabundància i de que la intel·ligència… 

…tot és exponencial…

  • …i que s'acabaran les malalties i que... 

…aquests també te'ls has llegit? Em fan molta mandra els Kurzweil, Diamandis i tota la colla.

  • Del Kurzweil dos, que en va treure un altre: després del de The Singularity is Near, The Singularity is Nearer.
  • I llavors el títol ve de que moltes d'aquestes prediccions, tant les unes com les altres, venen de la visió aquesta exponencial. Com que fins ara no era així, el món evolucionarà i llavors, com que ara ja tenim coses dolentes, doncs serà super dolenta, o com que ja tenim coses bones, serà super bona, no?
  • Però al món no hi ha res que sigui exponencial. Ni el Big Bang és exponencial. Tots són corbes S. Tot el que sembla exponencial s'acaba aturant. Tot. Tu mires la teva felicitat, com cau Lehman Brothers, una crisi, com cauen els imperis, com...

…les corbes d'adopció de tecnologia.

  • Totes són així.
  • Llavors, si t’hi fixes aquestes visions apocalíptiques o superoptimistes estan basades en una exponencialitat que jo crec que no existirà. I el que veiem ara és que estem entre una cosa i l'altra.
  • Llavors, jo el que intento explicar en el llibre, tant en l'àmbit de la tecnologia com en l'àmbit de l'economia, o en l'àmbit de diferents aspectes socials, com l'educació, és que hi haurà aspectes positius i que hi haurà aspectes negatius. 
  • Però que ni serà la catàstrofe de l'apocalipsi, ni serà el paradís en el qual no caldrà que treballem on tindrem l'ordinador o el robot que anirà a treballar, li donarem un petonet al matí i tornarà la nit amb el salari; enlloc de donar petonets als fills, donarem el petonet a l'iPhone.
  • Tot això són escenaris de ciència-ficció. En la realitat tenim el ChatGPT. Hem d'analitzar l'evolució del ChatGPT, que té implicacions, òbviament, econòmiques i socials. 
  • És el que analitza el llibre, però des de la perspectiva de la serenor, no de l'histerisme, que s'acaba el món i que vindran els robots i ens mataran a tots.

Això està molt ben argumentat al llibre. 

A veure, jo fa molts anys que et segueixo: des que als 90, treballant a IBM, vaig descobrir el web d’un professor d’economia català a Yale. Qui tenia un web en aquella època? Recordo que al web hi sortien dos dels teus referents: la Judit Mascó i la porca Peggy dels Muppets. 

Des d’aquell web, t’he anat seguint: als articles, a les teves participacions a ràdios i teles, als teus llibres d’economia… fins arribar a aquest darrer, que t’he de confessar que és un dels millors, més extensos i més profunds, dels llibres que he llegit sobre IA. 

I crec que la pregunta és obligada: què fot un economista parlant d’IA?

  • Això ho vam dir l'altre dia a la presentació [a la Casa del Llibre], però crec que és important recordar, que clar, quan la gent diu "que fot aquest paio parlant d’IA", jo vull parlar de l’origen: del Harari parlant de l'economia de la intel·ligència artificial…

…que és un historiador…

  • però, diguem, la intersecció entre l'economia i la intel·ligència artificial és el que ens interessa ara mateix, quines implicacions tindrà.
  • I això o ho parlen els economistes o ho parlen els experts en intel·ligència artificial. I per tant, algú ha de creuar el riu i anar-se'n a l'altra banda. O bé és algun expert en intel·ligència artificial com tu, que estudies economia, o bé és algun economista que estudia intel·ligència artificial.
  • Però si no, no es pot parlar amb criteri, perquè quan tu veus —jo llegeixo les anàlisis dels experts en intel·ligència artificial—, el Russell, que té seccions del seu llibre en què parla això, que fa multiplicacions —el PIB serà tal i tal, i per tant el PIB seran no sé quants trilions.
  • Dius, home, aquest paio no en té ni idea. I per tant algú ha de creuar i anar-se'n a l'altra banda i fer l'esforç durant set anys d'aprendre l'altra banda per poder parlar de la intersecció. Si no, no es pot parlar de la intersecció amb criteri.
  • I per això a mi m'interessava molt. Per poder parlar de si la intel·ligència artificial expandirà els llocs de treball, quines seran les implicacions en la productivitat, en el creixement, en les desigualtats… tot això jo haig d'entendre què és. Si no entenc què és, no puc parlar.
Una conversa entre Josep M. Ganyet i Xavier Sala i Martin | Marc Llibre
Una conversa entre Josep M. Ganyet i Xavier Sala i Martin | Marc Llibre

Sí, sí, jo recordo que potser el 2016 o el 2017, que també vam coincidir a Davos, em vas explicar —em va quedar gravat— que l'economia era la ciència que estudiava la felicitat; tot el que ens fa feliços costa diners o temps, esforç i dedicació, al final.

Quan et mires l'economia des d'aquest vessant, llavors entens la teva lògica. Perquè si deixes que la IA te l’expliqui un historiador especialitzat en història militar com el Harari, el relat és en termes de vencedors i vençuts. Per no parlar de les seves prediccions, que són tan vàlides com les de qualsevol persona.

Sembla lògic que algú que es dediqui a estudiar la felicitat creui a l'altra banda per veure quin impacte hi tindrà.

  • És així.

Bé, Xavier, acabem. Agraïr-te el teu temps i sobretot perquè confiessis en mi per a la revisió d’aquest llibre i l’anterior. De fet ho mencionaré a l'article, a mode d’exempció de responsabilitat (de disclaimer), dient que he format part del procés de refinat.

  • No, i del començament, tu ets part del principi i del final.

Sí, exacte. Per mi ha sigut molt estimulant, he llegit el llibre com una història, no de la tecnologia, no de la intel·ligència artificial —que també— sinó de l'enginy humà, de les idees; és una història de les idees humanes, que és una de les teves especialitats.

I després és un llibre que es pot llegir com vulguis; o sigui, si tu només t'interessa la part d'història o la part de l'impacte dels videojocs o la part de Bill Gates i Steve Jobs, ho tens allà.

No hi ha cap llibre —i també n'he llegit uns quants— que sigui capaç d'explicar-te la influència de Ramon Llull en el desenvolupament de la intel·ligència artificial, que la té, i que t'expliqui el funcionament de l'algorisme de backpropagation de manera comprensible. A mi, a la carrera, no ho m’ho van posar tan fàcil.

T’agraeixo molt haver pogut participar en el projecte.

  • El proper llibre l'hem de fer junts.

Escolta, per mi perfecte. Fem-lo junts. Tinc alguna idea, ja en parlarem. De moment ho deixem aquí, en exclusiva pel VIA Empresa.

  • Moltes gràcies, gràcies per l'entrevista, però també gràcies per ser l'origen i el punt final d'aquest llibre.

A vostè, Professor.


(1) “Intel·ligència és la capacitat que té un agent d’aproximar-se als seus objectius mitjançant les seves accions, tenint en compte les restriccions de l’entorn.”

(2) El Breakout és el famós joc d’Atari de trencar blocs amb una piloteta. Va ser prototipat per Steve Wozniak d’Apple i publicat el 1976. El 2017, l’AlphaZero de DeepMind hi va aprendre a jugar tot sol i va arribar a trobar en poques hores les estratègies que els humans fem servir per guanyar. (p. 446, Entre el Paradís i l’Apocalipsi)

(3) El 1997, el Deep Blue d’IBM va derrotar Garry Kaspàrov. Era el primer cop que un ordinador derrotava un gran mestre d’escacs.  (p. 308, Entre el Paradís i l’Apocalipsi)

(4) Deep Learning is Hitting a Wall, Gary Marcus, 10 de març del 2022.

(5) La conferència de Dartmouth a Nou Hampshire l’estiu del 1956 és quan s’encunya el terme IA. Es considera el punt de partida de la disciplina.  (p. 261, Entre el Paradís i l’Apocalipsi)

(6) Warren McCulloch i Walter Pitts basant-se en la feina de Ramon y Cajal són els primers que modelen matemàticament el funcionament de les neurones del cervell l’any 1943. El seu model és conegut com el model de McCulloch-Pitts. (p. 249, Entre el Paradís i l’Apocalipsi)

(7) El Perceptró és una evolució del model de neurona de McCulloch-Pitts desenvolupat per Frank Rosenblatt el 1957. La innovació és que ajustant els pesos de les entrades, el Perceptró podia “aprendre” a partir d’exemples. (p. 324, Entre el Paradís i l’Apocalipsi)

(8) Els Transformers són models d’IA especialitzats en entendre i generar text mitjançant un mecanisme d’atenció que capta el context global. Són la base de molts avenços recents en el processament del llenguatge natural. Van ser introduïts el 2017 per Google amb l’article Attention is All You Need(p. 533, Entre el Paradís i l’Apocalipsi)

(9) AlphaFold és un sistema d’IA desenvolupat per DeepMind que prediu amb gran precisió l’estructura tridimensional de les proteïnes. Va revolucionar la biologia molecular i per això els seus creadors, Demis Hassabis i John Jumper van rebre el Premi Nobel de Química el 2024. (p. 448, Entre el Paradís i l’Apocalipsi)

(10) AlexNet és una xarxa neuronal convolucional desenvolupada el 2012 per Alex Krizhevsky, Ilya Sutskever i Geoffrey Hinton a la Universitat de Toronto. Va guanyar el concurs ImageNet aquell any amb una precisió molt superior a la dels models anteriors, marcant un punt d'inflexió en la visió per computador i el camp de l'aprenentatge profund. (p. 362, Entre el Paradís i l’Apocalipsi)

(11) L'algorisme de backpropagation és una tècnica d'aprenentatge automàtic que ajusta els pesos d'una xarxa neuronal mitjançant la propagació enrere de l'error. Va ser formalitzat el 1970 per Seppo Linnainmaa i popularitzat per Geoffrey Hinton, David Rumelhart i Ronald Williams, el 1986. (p. 340, Entre el Paradís i l’Apocalipsi)

(12) Oriol Vinyals és un científic català especialitzat en aprenentatge profund i intel·ligència artificial. És conegut principalment per ser coautor del model seq2seq, que va revolucionar la traducció automàtica. És Vicepresident de Recerca a Google DeepMind i co-líder del projecte Gemini. (p. 525, Entre el Paradís i l’Apocalipsi)

(13) Ilya Sutskever és un dels pioners més influents en l'aprenentatge profund. Va co-inventar AlexNet el 2012, revolucionant la visió per computador, i va ser coautor del model seq2seq, clau en la traducció automàtica. Cofundador i científic en cap d'OpenAI, va liderar el desenvolupament de models com GPT. Actualment dirigeix Safe Superintelligence Inc., centrada en el desenvolupament segur de superintel·ligències artificials. (p. 360, Entre el Paradís i l’Apocalipsi)

(14) ELIZA és un dels primers programes de processament del llenguatge natural, desenvolupat entre 1964 i 1966 per Joseph Weizenbaum al MIT. Simulava un psicoterapeuta rogerià mitjançant regles de substitució de patrons, creant la il·lusió d'una conversa empàtica amb l'usuari. (p. 293, Entre el Paradís i l’Apocalipsi)