Etnògraf digital

DeepSeek: Sputnik o Andersen?

30 de Gener de 2025

El llançament dels models xinesos de DeepSeek ha provocat un moment Sputnik el sector tecnològic nord-americà. O això, o un moment Andersen per allò de que “el rei va nu”.

El DeepSeek-R1 està a nivell dels models més avançats d’OpenAI, Google o Anthropic, però per una fracció del cost, és de codi obert i, a més, és gratuït per a tothom. La seva irrupció en la bombolla mediàtica de la IA va fer caure NASDAQ d’un 3% i l’índex S&P d’un 1,5%. NVIDIA, el fabricant líder dels xips utilitzats en IA, va perdre 600.000 milions en un sol dia, la pèrdua més gran de la història. DeepSeek és un punt i a part en la cursa per la supremacia per la IA, un moment Sputnik o un moment Andersen, que sense saber si el què ha passat ha passat del cert, ja ho ha canviat tot.

DeepSeek és una startup xinesa d’IA fundada el 2023 amb seu a Hangzhou. Fundada per Liang Wenfeng, un empresari amb experiència en el sector financer i la IA, és finançada exclusivament pel fons d'inversió xinès High-Flyer, cofundat pel mateix Liang Wenfeng. Té com a missió desenvolupar models d’IA altament eficients i de baix cost.

No els en queda d'altra: les restriccions dels EUA a l'exportació dels xips més avançats, d'NVIDIA en aquest cas, obliguen les empreses xineses a buscar alternatives per desenvolupar IA sense accés a l'última generació de maquinari occidental.

Parlant de moment Sputnik i de guerra freda: el bloqueig tecnològic a la Xina és com el bloqueig a Cuba, però a escala. Recordo haver-hi vist a reparacions físicament impossibles a cotxes dels anys 40 per culpa de la prohibició dels EUA a la importació de recanvis. El DeepSeek seria allò de “Pueblo cubano, pueblo inventor”, però amb 1.411 milions de persones.

Tot indica que els enginyers de DeepSeek han trobat una manera intel·ligent de saltar-se les limitacions que els imposen les restriccions dels Estats Units. Les úniques GPU disponibles per a ells són les NVIDIA H800, menys potents que les H100 de darrera generació. Tenen, a més, limitacions imposades per programari. Un dels frens és en l’entorn de programació que NVIDIA proveeix als seus clients, no en el maquinari en si. Així que els enginyers de DeepSeek, en lloc de programar en aquest entorn d’alt nivell, amb llenguatges de programació intel·ligibles, van programar directament el codi en un llenguatge màquina, molt més lent i feixuc. Va ser així que van aconseguir un rendiment gairebé igual al dels xips de darrera generació.

Una de les conseqüències ha estat que la creació del model els ha sortit un 95% més barata que la de ChatGPT; la creació de models com ChatGPT s’estima que va costar 100 milions de dòlars; DeepSeek n’ha costat menys de 5,6.

Una altra gran diferència és que DeepSeek és de codi obert. Mentre que no sabem què passa dins de ChatGPT, ens podem descarregar el DeepSeek-R1 i veure’l per dins. Això vol dir que qualsevol persona, empresa o institució pot modificar-lo i entrenar-lo segons les seves necessitats, sense haver de dependre d’una corporació privada com OpenAI o Google o del govern xinès. De fet, jo me l’he baixat i el tinc funcionant al meu portàtil.

I el fenomen pop s’explica perquè DeepSeek és, a més, gratuït. No és que sigui gratuït a nivell ChatGPT, que n’ofereix una versió de franc sense funcionalitats avançades, no. DeepSeek permet que qualsevol usuari accedeixi al seu model més avançat sense barreres d’ús (de continguts en parlarem més endavant). El que porta l’Excel a OpenAI no havia previst l’escenari que algú regalés el seu producte.

Durant dècades, la Xina va ser vista com una economia basada en la còpia, on empreses tecnològiques copiaven models occidentals sense innovació pròpia. Kai-Fu Lee, expert en IA, inversor i ex-executiu de Google, Microsoft i Apple, explica al seu llibre AI Superpowers: China, Silicon Valley, and the New World Order que això ja no va així. El 2005, Wang Xing va clonar Facebook, tant que al web en xinès fins i tot el copyright de l’original estava copiat. Avui s’ha girat la truita i són les empreses americanes les que copien la Xina. El cas més clar és TikTok, que ha revolucionat la manera en què consumim contingut amb el format de vídeo curt, amb un algorisme ultra killer que ha entrat en el tauler geopolític internacional. Meta, YouTube i fins i tot Netflix han copiat aquest model amb Instagram Reels, YouTube Shorts i l’app Fast Laughs de Netflix. La Xina ha passat de ser un seguidor a marcar tendència en la tecnologia global, especialment en IA i xarxes socials.

"La Xina ha passat de ser un seguidor a marcar tendència en la tecnologia global"

Al seu llibre, Kai-Fu Lee analitza les diferències entre els emprenedors xinesos i els de Silicon Valley. Destaca que molts emprenedors nord-americans provenen de famílies amb antecedents acadèmics i professionals liberals, mentre que els emprenedors xinesos sovint tenen orígens més humils, amb pares que eren pagesos i que van patir fam. Aquesta diferència d'origen fa que els emprenedors xinesos estiguin més disposats a "embrutar-se les mans" i a involucrar-se en tasques que els seus homòlegs de Silicon Valley podrien considerar menys prestigioses. Aquesta actitud pragmàtica i la seva disposició a treballar en qualsevol àmbit els ha permès prosperar en l'ecosistema tecnològic global.

Tal com el llançament del satèl·lit soviètic Sputnik va provocar la cursa espacial i la creació de la NASA, la irrupció d’un rival xinès capaç de competir amb OpenAI i Anthropic amb una fracció del cost podria empènyer Washington a augmentar el suport governamental al sector tecnològic. Ja s’han vist moviments en aquesta direcció, amb inversors i empreses pressionant per nous incentius i finançament públic per evitar que els Estats Units perdin el lideratge en IA. A més, el Congrés podria intensificar les restriccions a les empreses xineses per continuar mantenint la supremacia en IA.

Tanmateix, la reacció negativa dels mercats davant DeepSeek també podria ser el final del conte del “Nou vestit del rei” de Hans Christian Andersen, un senyal que la bombolla de la IA comença a desinflar-se. La baixada massiva del NASDAQ i d’altres índexs tecnològics, és el reflex de la por que les inversions en IA estiguin sobrevalorades i que els models de negoci d’OpenAI i altres gegants del sector siguin en realitat castells de cartes. Si DeepSeek aconsegueix oferir un producte igual de potent, però molt més econòmic i obert, podria posar en dubte la sostenibilitat d’un mercat on s’han invertit bilions de dòlars sense entendre’n res de res.

Un altre nom que reverbera junt amb el d’Sputnik és el de Lighthill. L’Informe Lighthill, publicat el 1973 per Sir James Lighthill a petició del govern britànic, va ser un informe crític sobre l’estat de la recerca en IA. Lighthill argumentava que els avenços en IA havien estat massa lents i poc pràctics, i que la majoria de promeses fetes pels investigadors no s’havien complert. L’informe va concloure que l’IA no estava en condicions de produir aplicacions reals a curt termini i que la investigació en aquest camp no justificava les enormes inversions que s’hi estaven fent. Això va portar al govern britànic a retirar gran part del finançament públic per a la recerca en IA, especialment en àrees com el processament del llenguatge natural i la robòtica.

Les conseqüències de l’Informe Lighthill van ser devastadores per a la comunitat investigadora: va marcar l’inici del primer gran "hivern de la IA", un període en què el finançament i l’interès per la IA van caure dràsticament als Estats Units i Europa. Universitats i laboratoris van haver de cancel·lar projectes i molts investigadors es van veure obligats a canviar de camp. Aquest període de desil·lusió i estancament es va allargar fins a finals dels anys 80, quan els avenços en maquinari i noves tècniques com les xarxes neuronals van reactivar la disciplina. La història demostra que l’IA ha passat per cicles d’entusiasme i crisi. La gran incògnita és si DeepSeek és el nou Lighthill.

Fins aquí la versió no-oficial, oficial.

Però i si tot fos fals? I si tot fos una acció deliberada del govern xinès per influir en la guerra per la IA amb els EUA?

"I si tot fos una acció deliberada del govern xinès per influir en la guerra per la IA amb els EUA?"

Si DeepSeek fos una operació dissenyada pel govern xinès, no seria tant una innovació tecnològica —hi ha seriosos dubtes que ho sigui—, sinó una peça estratègica dins de la guerra freda tecnològica cada cop més calenta entre els EUA i la Xina. L’arribada en el moment precís d’un model que iguala o supera els seus rivals nord-americans, amb un cost radicalment inferior i un rendiment altament optimitzat, podria ser massa perfecta per ser només una casualitat. La crisi del model de negoci d’OpenAI i altres gegants de Silicon Valley podria ser un objectiu deliberat dins de la competició per la supremacia en IA.

El que sabem amb certesa és que DeepSeek censura amb una precisió sense precedents. La seva capacitat per evitar de parlar de Tiananmen, Taiwan, el Tibet o els Uigurs o de l’estimat líder Xi Jingping és a l'altura dels millors comissaris polítics. També és cert que és relativament fàcil fer-li jailbreak (fer-lo sortir del “personatge”), un fet sorprenent venint d’on ve. La censura delata la involucració del govern xinès que sense cap mena de dubte n’ha supervisat l’entrenament i el desplegament amb objectius geopolítics clars. DeepSeek no només és també un instrument de poder i influència, el que ens hauria d’obrir els ulls per veure que també ho són els models nord-americans.

També sabem que cap empresa xinesa pot llançar un producte al mercat internacional sense el permís explícit del Partit Comunista Xinès, especialment quan es tracta de tecnologia estratègica com la IA. Si el govern xinès ha permès que DeepSeek es difongui lliurement, vol dir que confia plenament en les seves salvaguardes i mecanismes de control, assegurant-se que, malgrat ser obert, el model mai podrà ser utilitzat contra els interessos del règim.

En Vicent Partal té una teoria unificadora molt interessant que explica el perquè de tot plegat: la decisió de la Xina d’alliberar els models de DeepSeek com a codi obert no és casualitat, sinó una estratègia calculada per desactivar l’avantatge nord-americà en la cursa per la IA. Ho explica molt bé en un vídeo recent.

Els EUA han apostat per convertir la IA en un camp de batalla bilateral, seguint la mateixa lògica que van utilitzar en el passat amb el Projecte Manhattan, que els va donar la bomba atòmica, o amb el programa espacial que els va permetre arribar a superar la Unió Soviètica. La IA és la nova cursa en la qual també es volen imposar. Però la Xina, en comptes d’entrar en una competició de recursos directes amb els EUA, una competició que sense accés als xips més avançats no pot guanyar, ha decidit jugar una altra carta: convertir la cursa en multilateral i obrir els models de DeepSeek a tothom.

"Els EUA han apostat per convertir la IA en un camp de batalla bilateral, però la Xina ha decidit jugar una altra carta"

Amb aquest moviment, Pequín no només ha trencat la dinàmica de superpotència única en IA, sinó que ha facilitat que altres països puguin desenvolupar els seus propis models d’IA de primer nivell. En poc temps podríem veure LLMs desenvolupats, per exemple, per països dels BRICS (Brasil, Rússia, Índia, Sud-àfrica i Spain, segons Trump) basats en DeepSeek-V3, disputant l’hegemonia a OpenAI, Google i Meta; d’una cursa per la supremacia en IA bipolar amb un enemic clar, a una cursa multipolar i busca qui t’ha pegat. Amb aquest moviment el moviment de la Xina no només equilibra la balança geopolítica, sinó que pot transformar la IA en un domini descentralitzat, on els països en desenvolupament ja no depenguin de les grans corporacions nord-americanes. I això és bo per a la gent de cor senzill.

La Xina és una dictadura i ja sabem com gestionen la informació les dictadures. Al llarg de la història hem assistit a les mentides repetides d’aital estat totalitari, les darreres durant la covid amb conseqüències fatals per a milions de persones. Ara la Xina ens sembla molt simpàtica perquè planta cara als EUA més antipàtics de la història i ens han donat TikTok. Sembla que la desinformació continua també al voltant de DeepSeek.

Una de les darreres informacions al voltant de l’afer la publicava ahir el Financial Times. Segons el mitjà, OpenAI ha afirmat que té proves que la startup xinesa DeepSeek ha utilitzat els seus models propietaris per entrenar els seus de codi obert, el que representa una violació de la propietat intel·lectual. Segons OpenAI, DeepSeek hauria emprat una tècnica anomenada "distil·lació", consistent a utilitzar les sortides de models més grans i avançats per millorar el rendiment de models més petits. Fent això s’aconsegueixen resultats similars en tasques específiques a un cost molt inferior. Aquesta pràctica és comuna en la indústria de la IA, però utilitzar els models d’OpenAI per a crear un competidor directe en vulnera els termes de servei.

"Ara la Xina ens sembla molt simpàtica perquè planta cara als EUA més antipàtics de la història i ens han donat TikTok"

Una investigació de Microsoft també conclou que DeepSeek podria haver accedit a les API d'OpenAI a gran escala, possiblement superant els límits establerts, per obtenir dades que posteriorment van ser utilitzades per desenvolupar el seu propi model.

Hi ha un altre aspecte important: la privadesa i la propietat de les dades. DeepSeek és l’aplicació més descarregada del moment a les botigues d’apps, i els seus servidors s’han vist desbordats fins al punt de patir sobrecàrregues constants (és d’ells). Això a banda de confirmar el fenomen pop, suposa un avantatge inesperat per a DeepSeek: milions, possiblement milers de milions de persones, estan interactuant amb els seus models i, sense saber-ho, alimentant-lo amb dades i meta-dades noves dades que Xi Jinping veu passar per la pantalla del seu portàtil a l’estil de Matrix. Recordeu que els models d’IA ja no els queden dades noves d’internet per utilitzar per als seus entrenaments. Totes les interaccions que hi fem serviran per a millorar els models en un futur.

No sabem encara si DeepSeek marcarà un moment Sputnik, accelerant la cursa per la IA, o si serà un moment Andersen, revelant que el rei va nu i fent esclatar la bombolla del sector. Pot ser l’inici d’una autèntica revolució tecnològica i geopolítica, o potser el fake millor orquestrat de la història. Sigui com sigui, el seu impacte ja ha alterat l’escenari global, posant en qüestió el model de negoci de Silicon Valley i obrint la porta a una IA més descentralitzada i competitiva. Mentre el món es pregunta què és real i què no, no em puc treure del cap Sir Michael James Lighthill i el seu informe, que un dia de 1973 de va establir de manera rotunda la diferència entre progrés i filfa, entre Sputnik i el rei de Hans Christian Andersen.