Las demos las carga el demonio

16 de Mayo de 2024
Josep Maria Ganyet | VIA Empresa

Semana intensa en cuanto a la IA generativa. El lunes OpenAI presentaba su nuevo ChatGPT 4o y al día siguiente Google presentaba en su conferencia anual para desarrolladores Google I/O más novedades de las que podemos procesar.

Siempre me ha hecho gracia esta manera que tiene Google de denominar sus productos. El nombre de Google I/O hace de mal escribir; Gemini, su modelo insignia de IA se llamaba Bard; Android, que es un sistema operativo, tiene nombre de robot; una de las novedades que vimos el martes en el Google I/O es un bloque de notas basado en IA que lleva el críptico nombre de LearnLM. Y podríamos continuar. Quiero pensar que en realidad todo este despropósito mnemotécnico es un homenaje al nombre de la empresa que tenía que ser googol (el nombre de la cifra de un uno seguido de cien ceros), pero que acabaron registrando como Google por un error fonético.

OpenAI presentó novedades relevantes el lunes para contraprogramar los anuncios que se preveían de Google. A pesar de muchas de las novedades en su ChatGPT 4o —más contexto, búsqueda en la web, más accesible en la versión gratuita, más interacciones para los miembros premium— lo que captó la atención y la imaginación de todo el mundo fueron los vídeos de gente conversando con la versión móvil de ChatGPT 4o de manera natural. Las respuestas, en voz, son muy fluidas, con entonación natural, permiten las interrupciones y muestran un cierto sentido del humor. También se ve cómo de manera natural cambian de voz a vídeo y ChatGPT 4o responde dónde estamos, qué hacemos y asiste en preguntas de trabajo. La reacción unánime en las redes fue de "Hemos llegado a Her", en referencia al asistente de la película Her de Spike Jonze. De momento todavía no está accesible para todo el mundo y los usuarios premium iremos teniendo acceso de manera controlada.

Y el martes fue el turno de Google. Hasta ayer, las presentaciones de OpenAI habían cogido a Google con el pie cambiado. Ya desde el principio en can Google fueron muy cautos a la hora de liberar servicios basados en IA generativa; internamente se referían a ChatGPT como "el prototipo". Recordemos que la tecnología GPT se desarrolló en Google y la tenía en el cajón. Querría pensar que era por ética social, por las dudas alrededor de su impacto en la sociedad, pero creo que lo hicieron por razones empresariales resumidas en el dilema del innovador: si saco un asistente basado en IA que tenga todas las respuestas canibalizo el modelo de negocio de mi buscador de Google.

"Parece que el gorila ha salido a la pista borracho de IA y ha barrido a todo el mundo"

Satya Nadella, el CEO de Microsoft, al incorporar ChatGPT a su buscador Bing dijo que ellos eran muy pequeños (un 3%) y que si esto hacía salir "al gorila de 400 kilos a bailar", en referencia a Google, ya lo daba por bueno. Pues parece que el gorila ha salido a la pista borracho de IA y ha barrido a todo el mundo. Y esto es un mal presagio para OpenAI, pero también para Apple que está trabajando y que en junio presenta novedades en IA.

Digo que el gorila salió borracho de IA por que los 110 minutos que bailó el martes en la Google I/O (el maldito nombre otra vez), el término IA se mencionó 121 veces, más de una vez por minuto. El dato no es mío, es de la gente de Techcrunch que se entretuvieron a contarlo. Debe de ser por eso que titularon la sección donde hablaban có¡omo "AI ad nauseam".

Google presentó todo tipo de novedades; una ventana al futuro inmediato que nos espera: el bloque de notas LearnLM, capaz de "leer", "visionar" vídeos, "escuchar" lecciones y hacernos lecciones, preguntas y conversar, adaptándose así a las necesidades de cada estudiante; una plataforma para crear música generativa; un generador de imágenes con unos resultados ultrarealistas; Veo, un modelo capaz de generar secuencias de hasta 60 segundos. Presentaron muchas más cosas, pero querría destacar dos más que creo que serán las que más impacto social tendrán.

Demis Hasabis, el CEO de Google DeepMind, con su fuerte acento británico, presentó el Project Astra, el más espectacular (y del futuro) que vimos. En una demo en vídeo similar a la que habíamos visto el día antes de OpenAI, se ve a una chica que, móvil en mano, va filmando su oficina mientras le va preguntando cosas. Le pide "dime cuando encuentres algo que haga sonido" y Astra identifica un altavoz encima la mesa; le pide que haga creación literaria mientras enfoca un bote de colores y le hace un haiku que todas las palabras empiezan en ce; apunta el móvil a una pantalla donde hay el código de un programa y identifica la funcionalidad; apunta el móvil a la ventana, le pregunta por el barrio y Astra responde que le parece que es King's Cross, en Londres. Finalmente le pregunta por donde se ha dejado las gafas que han pasado fugazmente ante la cámara mientras se dirigía hacia la ventana: "Encima de la mesa, junto a la manzana roja". Impresiona mucho, miráis-lo.

Y si la demo de Asta es de lo más espectacular que nunca hayáis visto, Gemini, el  xatbot que Google aplica a todo es el que tiene el potencial transformador más grande, más que nada porque todos somos usuarios de Google. La búsqueda de Google, que cada vez es menos eficiente, evoluciona hacia un modelo que se asemeja mucho más a uno ChatGPT que a Google tal y como lo conocemos. Y aquí OpenAI pierde; su intento de conectarlo con la web intermediando Bing palidece ante la potencia de Google y el acceso que tiene a información en calidad, cantidad y profundidad.

Vimos una demostración de cómo será la nueva búsqueda: será la IA quién haga el trabajo aburrido. Si hasta ahora para organizar un viaje teníamos que ir echando búsquedas, saltar de web en web, leer blogs de viajeros, comprar billetes, y reservar hoteles, a partir de ahora solo habrá que pedirle qué queremos y Gemine nos lo organizará. La demo que vimos era de alguien que se tenía que trasladar a vivir a Chicagi: Google le organizaba la mudanza, cambios de dirección a los diferentes servicios en linea incluidos.

"La busqueda de Google, que cada vez es menos eficiente, evoluciona hacia un modelo que se asemeja mucho más a un ChatGPT que a Google tal y como lo conocemos"

Visto todo esto quise viajar yo también al futuro.

Empecé con el flamante ChatGPT 4o y le pregunté por las elecciones en el Parlamento de . Catalunya. Ahora tiene conexión en la web y no le costó nada encontrar toda la información con el buscador Bing de Microsoft. Me hizo una crónica excelente: victoria del PSC, subida del bloque independentista, subida de ERC y abstención que perjudicó al bloque unionista. ¿Qué? Resulta que la información era de las elecciones del 2021. Me di cuenta porque había seguido mínimamente la campaña y el escrutinio. El periodista de Londres o el alumno de ciencias políticas que harán copiar y pegar se quedarán tan anchas.

También le pedí por el "nombre del primer oso que atravesó el estrecho de Gibraltar". Me dijo que se decía "Fulgencio" y que era una iniciativa para concienciar sobre los retos a los que se afrontan los osos polares por culpa del cambio climático.

chatgpt
Consulta de M. Josep Ganyet a ChatGPT 4o sobre el primer oso que atravesó el estrecho de Gibraltar

Lo probé con el Gemini de Google. Le pedí que me preparara una ruta de 4 días para tres personas por Peloponeso, con lugares de interés, restaurantes y hoteles sin que me costara un ojo de la cara. No empezamos bien porque la primera recomendación que me hizo incluía un día en Atenas. Se lo hice notar y me hizo un recorrido magnífico con referencias, fotografías, enlaces y cálculo de cuánto me gastaría en total. Una de las recomendaciones era la del pintoresco pueblo de Oia donde me recomendaba conducir después de haber visitado los restos arqueológicos de Micenas. Buena, no lo conocía, a pesar de haber estado anteriormente en Peloponeso. No lo conocía porque Oia está en la isla de Santorini.

Cuando trabajaba en IBM en los 90 corría el chiste del informático que al morir San Pedro lo deja elegir entre ir al cielo o al infierno. Le mostró el cielo: fresqco, música de lira, ángeles asexuados y santos calvos con aureola y barba. Después bajó al infierno y Pere Botero le enseñó: se estaba caliente, pulsera de todo incluido, sonaba Disco Infern de The Tramps con las go-go bailando encima las mesas. Volvió al cielo para comunicar a Sant Pedro que se decidía por el infierno. Cuando volvió encontró las canónicas ollas llenas de pecadores mientras los hervían. Enfadado, preguntó a Pedro Botero que qué representaba aquello, que lo que había visto antes era muy diferente. Pere Botero le replicó: "Es que antes os hemos enseñado la demo".