Etnógrafo digital

DeepSeek: ¿Sputnik o Andersen?

30 de Enero de 2025
Josep Maria Ganyet | VIA Empresa

El lanzamiento de los modelos chinos de DeepSeek ha provocado un momento Sputnik en el sector tecnológico norteamericano. O eso, o un momento Andersen por aquello de que “el rey va desnudo”.

 

El DeepSeek-R1 está al nivel de los modelos más avanzados de OpenAI, Google o Anthropic, pero por una fracción del coste, es de código abierto y, además, es gratuito para todos. Su irrupción en la burbuja mediática de la IA hizo caer a NASDAQ un 3% y el índice S&P un 1,5%. NVIDIA, el fabricante líder de los chips utilizados en IA, perdió 600.000 millones en un solo día, la pérdida más grande de la historia. DeepSeek es un punto y aparte en la carrera por la supremacía de la IA, un momento Sputnik o un momento Andersen, que sin saber si lo que ha pasado ha pasado de verdad, ya lo ha cambiado todo. 

DeepSeek es una startup china de IA fundada en 2023 con sede en Hangzhou. Fundada por Liang Wenfeng, un empresario con experiencia en el sector financiero y la IA, está financiada exclusivamente por el fondo de inversión chino High-Flyer, cofundado por el mismo Liang Wenfeng. Tiene como misión desarrollar modelos de IA altamente eficientes y de bajo coste.

 

No les queda otra: las restricciones de EE. UU. a la exportación de los chips más avanzados, de NVIDIA en este caso, obligan a las empresas chinas a buscar alternativas para desarrollar IA sin acceso a la última generación de hardware occidental.

Hablando de momento Sputnik y de guerra fría: el bloqueo tecnológico a China es como el bloqueo a Cuba, pero a escala. Recuerdo haber visto reparaciones físicamente imposibles en coches de los años 40 por culpa de la prohibición de EE. UU. a la importación de recambios. El DeepSeek sería aquello de “Pueblo cubano, pueblo inventor”, pero con 1.411 millones de personas.

Todo indica que los ingenieros de DeepSeek han encontrado una manera inteligente de saltarse las limitaciones que les imponen las restricciones de los Estados Unidos. Las únicas GPU disponibles para ellos son las NVIDIA H800, menos potentes que las H100 de última generación. Tienen, además, limitaciones impuestas por software. Uno de los frenos está en el entorno de programación que NVIDIA provee a sus clientes, no en el hardware en sí. Así que los ingenieros de DeepSeek, en lugar de programar en este entorno de alto nivel, con lenguajes de programación inteligibles, programaron directamente el código en un lenguaje máquina, mucho más lento y engorroso. Fue así que lograron un rendimiento casi igual al de los chips de última generación.

Una de las consecuencias ha sido que la creación del modelo les ha salido un 95% más barata que la de ChatGPT; la creación de modelos como ChatGPT se estima que costó 100 millones de dólares; DeepSeek ha costado menos de 5,6.

Otra gran diferencia es que DeepSeek es de código abierto. Mientras que no sabemos qué pasa dentro de ChatGPT, podemos descargar el DeepSeek-R1 y verlo por dentro. Esto significa que cualquier persona, empresa o institución puede modificarlo y entrenarlo según sus necesidades, sin tener que depender de una corporación privada como OpenAI o Google o del gobierno chino. De hecho, yo me lo he descargado y lo tengo funcionando en mi portátil.

Y el fenómeno pop se explica porque DeepSeek es, además, gratuito. No es que sea gratuito a nivel ChatGPT, que ofrece una versión gratuita sin funcionalidades avanzadas, no. DeepSeek permite que cualquier usuario acceda a su modelo más avanzado sin barreras de uso (de contenidos hablaremos más adelante). El que lleva el Excel en OpenAI no había previsto el escenario de que alguien regalase su producto.

Durante décadas, China fue vista como una economía basada en la copia, donde empresas tecnológicas replicaban modelos occidentales sin innovación propia. Kai-Fu Lee, experto en IA, inversor y ex-ejecutivo de Google, Microsoft y Apple, explica en su libro AI Superpowers: China, Silicon Valley, and the New World Order que esto ya no es así. En 2005, Wang Xing clonó Facebook, tanto que en la web en chino incluso el copyright del original estaba copiado. Hoy se ha girado la tortilla y son las empresas americanas las que copian a China. El caso más claro es TikTok, que ha revolucionado la manera en que consumimos contenido con el formato de vídeo corto, con un algoritmo ultra killer que ha entrado en el tablero geopolítico internacional. Meta, YouTube e incluso Netflix han copiado este modelo con Instagram Reels, YouTube Shorts y la app Fast Laughs de Netflix. China ha pasado de ser un seguidor a marcar tendencia en la tecnología global, especialmente en IA y redes sociales.

“China ha pasado de ser un seguidor a marcar tendencia en la tecnología global”

En su libro, Kai-Fu Lee analiza las diferencias entre los emprendedores chinos y los de Silicon Valley. Destaca que muchos emprendedores norteamericanos provienen de familias con antecedentes académicos y profesionales liberales, mientras que los emprendedores chinos a menudo tienen orígenes más humildes, con padres que eran campesinos y que sufrieron hambre. Esta diferencia de origen hace que los emprendedores chinos estén más dispuestos a “ensuciarse las manos” y a involucrarse en tareas que sus homólogos de Silicon Valley podrían considerar menos prestigiosas. Esta actitud pragmática y su disposición a trabajar en cualquier ámbito les ha permitido prosperar en el ecosistema tecnológico global.

Tal como el lanzamiento del satélite soviético Sputnik provocó la carrera espacial y la creación de la NASA, la irrupción de un rival chino capaz de competir con OpenAI y Anthropic con una fracción del coste podría empujar a Washington a aumentar el apoyo gubernamental al sector tecnológico. Ya se han visto movimientos en esta dirección, con inversores y empresas presionando por nuevos incentivos y financiamiento público para evitar que los Estados Unidos pierdan el liderazgo en IA. Además, el Congreso podría intensificar las restricciones a las empresas chinas para continuar manteniendo la supremacía en IA.

Sin embargo, la reacción negativa de los mercados ante DeepSeek también podría ser el final del cuento del “Nuevo traje del rey” de Hans Christian Andersen, una señal de que la burbuja de la IA comenzaba a desinflarse. La bajada masiva del NASDAQ y de otros índices tecnológicos es el reflejo del miedo a que las inversiones en IA estén sobrevaloradas y que los modelos de negocio de OpenAI y otros gigantes del sector sean en realidad castillos de naipes. Si DeepSeek logra ofrecer un producto igual de potente, pero mucho más económico y abierto, podría poner en duda la sostenibilidad de un mercado donde se han invertido billones de dólares sin entender nada de nada.

Otro nombre que reverbera junto con el de Sputnik es el de Lighthill. El Informe Lighthill, publicado en 1973 por Sir James Lighthill a petición del gobierno británico, fue un informe crítico sobre el estado de la investigación en IA. Lighthill argumentaba que los avances en IA habían sido demasiado lentos y poco prácticos, y que la mayoría de promesas hechas por los investigadores no se habían cumplido. El informe concluyó que la IA no estaba en condiciones de producir aplicaciones reales a corto plazo y que la investigación en este campo no justificaba las enormes inversiones que se estaban haciendo. Esto llevó al gobierno británico a retirar gran parte del financiamiento público para la investigación en IA, especialmente en áreas como el procesamiento del lenguaje natural y la robótica.

Las consecuencias del Informe Lighthill fueron devastadoras para la comunidad investigadora: marcó el inicio del primer gran "invierno de la IA", un período en el que el financiamiento y el interés por la IA cayeron drásticamente en los Estados Unidos y Europa. Universidades y laboratorios tuvieron que cancelar proyectos y muchos investigadores se vieron obligados a cambiar de campo. Este período de desilusión y estancamiento se alargó hasta finales de los años 80, cuando los avances en hardware y nuevas técnicas como las redes neuronales reactivaron la disciplina. La historia demuestra que la IA ha pasado por ciclos de entusiasmo y crisis. La gran incógnita es si DeepSeek es el nuevo Lighthill.

Hasta aquí la versión no oficial, oficial.

Pero, ¿y si todo fuera falso? ¿Y si todo fuera una acción deliberada del gobierno chino para influir en la guerra por la IA con los EE. UU.?

“¿Y si todo fuera una acción deliberada del gobierno chino para influir en la guerra por la IA con los EE. UU.?”

Si DeepSeek fuera una operación diseñada por el gobierno chino, no sería tanto una innovación tecnológica —hay serias dudas de que lo sea—, sino una pieza estratégica dentro de la guerra fría tecnológica cada vez más caliente entre los EE. UU. y China. La llegada en el momento preciso de un modelo que iguala o supera a sus rivales norteamericanos, con un coste radicalmente inferior y un rendimiento altamente optimizado, podría ser demasiado perfecta para ser solo una casualidad. La crisis del modelo de negocio de OpenAI y otros gigantes de Silicon Valley podría ser un objetivo deliberado dentro de la competencia por la supremacía en IA.

Lo que sabemos con certeza es que DeepSeek censura con una precisión sin precedentes. Su capacidad para evitar hablar de Tiananmen, Taiwán, el Tíbet o los Uigures o del estimado líder Xi Jinping está a la altura de los mejores comisarios políticos. También es cierto que es relativamente fácil hacerle jailbreak (sacarlo del “personaje”), un hecho sorprendente viniendo de donde viene. La censura delata la involucración del gobierno chino que sin ninguna duda ha supervisado el entrenamiento y el despliegue con objetivos geopolíticos claros. DeepSeek no solo es también un instrumento de poder e influencia, lo que debería abrirnos los ojos para ver que también lo son los modelos norteamericanos.

También sabemos que ninguna empresa china puede lanzar un producto al mercado internacional sin el permiso explícito del Partido Comunista Chino, especialmente cuando se trata de tecnología estratégica como la IA. Si el gobierno chino ha permitido que DeepSeek se difunda libremente, significa que confía plenamente en sus salvaguardas y mecanismos de control, asegurándose de que, a pesar de ser abierto, el modelo nunca podrá ser utilizado contra los intereses del régimen.

Vicent Partal tiene una teoría unificadora muy interesante que explica el porqué de todo esto: la decisión de China de liberar los modelos de DeepSeek como código abierto no es casualidad, sino una estrategia calculada para desactivar la ventaja norteamericana en la carrera por la IA.  Lo explica muy bien en un vídeo reciente.

Los EE. UU. han apostado por convertir la IA en un campo de batalla bilateral, siguiendo la misma lógica que utilizaron en el pasado con el Proyecto Manhattan, que les dio la bomba atómica, o con el programa espacial que les permitió superar a la Unión Soviética. La IA es la nueva carrera en la que también se quieren imponer. Pero China, en lugar de entrar en una competencia de recursos directos con los EE. UU., una competencia que sin acceso a los chips más avanzados no puede ganar, ha decidido jugar otra carta: convertir la carrera en multilateral y abrir los modelos de DeepSeek a todos.

“Los EE. UU. han apostado por convertir la IA en un campo de batalla bilateral, pero China ha decidido jugar otra carta”

Con este movimiento, Pekín no solo ha roto la dinámica de superpotencia única en IA, sino que ha facilitado que otros países puedan desarrollar sus propios modelos de IA de primer nivel. En poco tiempo podríamos ver LLMs desarrollados, por ejemplo, por países de los BRICS (Brasil, Rusia, India, Sudáfrica y España, según Trump) basados en DeepSeek-V3, disputando la hegemonía a OpenAI, Google y Meta; de una carrera por la supremacía en IA bipolar con un enemigo claro, a una carrera multipolar y busca quién te ha pegado. Con este movimiento el movimiento de China no solo equilibra la balanza geopolítica, sino que puede transformar la IA en un dominio descentralizado, donde los países en desarrollo ya no dependan de las grandes corporaciones norteamericanas. Y esto es bueno para la gente de corazón sencillo.

China es una dictadura y ya sabemos cómo gestionan la información las dictaduras. A lo largo de la historia hemos asistido a las mentiras repetidas de tal estado totalitario, las últimas durante la covid con consecuencias fatales para millones de personas. Ahora China nos parece muy simpática porque planta cara a los EE. UU. más antipáticos de la historia y nos han dado TikTok. Parece que la desinformación continúa también alrededor de DeepSeek.

Una de las últimas informaciones alrededor del asunto la publicaba ayer el Financial Times. Según el medio, OpenAI ha afirmado que tiene pruebas de que la startup china DeepSeek ha utilizado sus modelos propietarios para entrenar los suyos de código abierto, lo que representa una violación de la propiedad intelectual. Según OpenAI, DeepSeek habría empleado una técnica llamada “destilación”, consistente en utilizar las salidas de modelos más grandes y avanzados para mejorar el rendimiento de modelos más pequeños. Haciendo esto se logran resultados similares en tareas específicas a un costo muy inferior. Esta práctica es común en la industria de la IA, pero utilizar los modelos de OpenAI para crear un competidor directo vulnera los términos de servicio.

“Ahora China nos parece muy simpática porque planta cara a los EE. UU. más antipáticos de la historia y nos han dado TikTok”

Una investigación de Microsoft también concluye que DeepSeek podría haber accedido a las API de OpenAI a gran escala, posiblemente superando los límites establecidos, para obtener datos que posteriormente fueron utilizados para desarrollar su propio modelo. 

Hay otro aspecto importante: la privacidad y la propiedad de los datos. DeepSeek es la aplicación más descargada del momento en las tiendas de apps, y sus servidores se han visto desbordados hasta el punto de sufrir sobrecargas constantes (es de ellos). Así que además de confirmar el fenómeno pop, supone una ventaja inesperada para DeepSeek: millones, posiblemente miles de millones de personas, están interactuando con sus modelos y, sin saberlo, alimentándolo con datos y metadatos nuevos que Xi Jinping ve pasar por la pantalla de su portátil al estilo de Matrix. Recuerden que a los modelos de IA ya no les quedan datos nuevos de internet para utilizar para sus entrenamientos. Todas las interacciones que hacemos servirán para mejorar los modelos en un futuro.

No sabemos aún si DeepSeek marcará un momento Sputnik, acelerando la carrera por la IA, o si será un momento Andersen, revelando que el rey va desnudo y haciendo estallar la burbuja del sector. Puede ser el inicio de una auténtica revolución tecnológica y geopolítica, o quizás el fake mejor orquestado de la historia. Sea como sea, su impacto ya ha alterado el escenario global, poniendo en cuestión el modelo de negocio de Silicon Valley y abriendo la puerta a una IA más descentralizada y competitiva. Mientras el mundo se pregunta qué es real y qué no, no puedo sacarme de la cabeza a Sir Michael James Lighthill y su informe, que un día de 1973 estableció de manera rotunda la diferencia entre progreso y filfa, entre Sputnik y el rey de Hans Christian Andersen.