Cómo aprende idiomas Siri?

El asistente virtual de los productos de Apple requiere un complejo proceso para ser capaz de entender y hablar cada nueva lengua

La historia que hay detrás de Siri, el asistente personal que hay a todos los iPhones, iPads y Macs, es fuerza curiosa. A pesar de ser un producto de Apple, su origen se remonta al año 2007, en el Centro de Inteligencia SRIInternational , como espín-off de un programa de investigación de la DARPA –la división de investigación de las fuerzas armadas de los Estados Unidos–.

El 4 de octubre de 2011, Apple lo presentó como producto propio y parte del entonces nuevo iPhone 4S, con integración conversacional con aplicaciones como los recordatorios, el estado del tiempo, la bolsa, mensajes, correo electrónico, calendario, contactos, notas, reloj, mapas y una inacabable lista de servicios de terceros.

Con el tiempo no tardaron a salirle competidores como por ejemplo Google Now y Microsoft Cortana. Todos ellos bastante avanzados, pero con una gran carencia respecto a Siri: los idiomas.

Actualmente el asistente de Apple es capaz de hablar y comprender muchos más idiomas que su competencia y esto lo hace parecer, sin duda, mucho más inteligente.

Alex Acero, responsable del equipo de pronuncia de Siri, explicó hace unos días como era el proceso de Siri para aprender un nuevo idioma. Y es fuerza más complejo del que pueda parecer.

Inicialmente, Apple licenció una plataforma de voz de Nuance para alimentar la base lingüística de su asistente virtual, pero desde el año 2013 ya utiliza una de propia.

Aprender un nuevo idioma
Para enseñar un nuevo idioma a Siri, Apple selecciona un grupo de personas de diferentes zonas geográficas donde se habla la lengua en cuestión, de forma que este grupo cubra el mayor número de pronunciaciones y dialectos de la lengua. Un golpe elegidos, se los pide que lean unos párrafos de texto seleccionados y una serie de palabras.

Un golpe hecho, estas grabaciones se transcriben y marcan de manera manual por humanos, de forma que se consigue verificar exactamente las variaciones de cada palabra. A partir de aquí, los resultados se envían a un algoritmo de inteligencia artificial que las procesa, clasifica y aprende.



En base a este proceso, la inteligencia artificial empieza a predecir la manera correcta de pronunciar varias palabras que no figuran en la grabación inicial, y empieza a generar palabras y frases cumplidas.

Pero el punto más brillante del proceso es que este algoritmo de análisis no deja nunca de trabajar. Cada vez que usamos Siri para darle una orden o dictarle una cadena de texto, la inteligencia artificial analiza la nuestra pronuncia y la incorpora a su base de datos.

Antes de enviar el nuevo paquete de idioma a Siri, Apple lo introduce en el sistema de dictado de iOS y GUAPOS (sabéis que los dispositivos de Apple pueden escribir texto a partir de la voz, oi?), y con los datos de voz que obtiene de sus usuarios un nuevo grupo de humanos transcribe muestras de manera manual para afinar todavía más la pronunciación.

Finalmente, después de todo este proceso, Apple publica una actualización de software que incorpora el nuevo idioma.

Más allá de la curiosidad de cómo de complejo es el proceso, conocerlo nos da esperanza que el catalán pueda sumarse pronto a la lista de idiomas soportados por Siri. Actualmente, los Mac e iPhone ya lo soportan como lengua de dictado.
Hoy Destacamos
Lo más leido