Todos los acentos de AINA

17 de Febrero de 2022

Mi hijo habla catalán con acento de Lleida conmigo, de Barcelona en el pueblo del Maresme donde vivimos y catanyol en el instituto. Con su madre habla italiano con acento del sur y de vez en cuando suelta alguna frase en napolitano. Y como que la Alexa de la cocina la tenemos configuranda en inglés e italiano, en casa hablamos indistintamente catalán, italiano e inglés dependiendo de quien inicie la conversación o a quien vaya dirigida.

No somos un caso tan extraño; el 60% de la población mundial habla más de una lengua de manera fluida y de estos, un 13% habla tres. Sólo un 40% de la gente es monolingüe. Estadísticamente, se demuestra que los hablantes de lenguas mayoritarias tienen poco interés en aprender una segunda lengua, puesto que tienen la percepción que el resto del mundo ya habla la suya.

Quizás la cosa que resulte más extraña de nuestro ambiente lingüístico casero es el hecho de que con los robots de casa —esto incluye la Roomba— hablamos en inglés. No nos es una lengua extraña en entornos de trabajo o de ocio (pensáis en Netflix) pero sí que lo es en un entorno familiar. La causa de la presencia cotidiana del inglés es que el Alexa —y el resto de asistentes de móviles o de dispositivos— no entienden el catalán. La decisión de configurar Alexa en inglés fue tripartita: 1) funciona mejor en inglés que en cualquier otra lengua, 2) nos permite practicar la lengua de James Gandolfini y 3) la configuración en inglés de los EE.UU. tiene una versión italo-americana que permite la interacción en inglés e italiano a la vez. Los diálogos con la Alexa de la cocina podrían salir en los Soprano.

Si por un lado estamos rompiendo barreras de acceso tecnológicas, no tiene ningún sentido que por el otro levantemos culturales o lingüísticas

Los ordenadores han pasado en poco más de 60 años de ocupar plantas enteras de empresas y universidades a caber en la palma de la mano. Un móvil de hoy tiene la potencia de cálculo de un superordenador de hace 25 años: en cada generación los ordenadores son más pequeños y su tendencia natural es a la desaparición. Los asistentes de voz son los primeros pasos de lo que denominamos computación ambiental: ordenadores invisibles con los cuales interactuamos de manera natural. Y la manera más natural que tenemos las personas de interactuar es el habla.

Los primeros ordenadores sólo estaban al alcance de ingenieros que los programaban durante semanas cambiando físicamente el cableado. Hoy cualquiera puede editar un vídeo en 4k en un teléfono móvil sólo haciendo ir un dedo. Más gente ha entrado en la computación en los últimos diez años de la mano de las videoconferencias en el móvil que en los últimos 60 años. A cada nueva generación hemos tenido más ordenadores, más rápidos y más gente los ha utilizado. Podríamos resumir la evolución de la interacción con ordenadores en: cables, tarjetas perforadas, líneas de pedidos, ratón, dedo y voz. La evolución de las interfaces es también la evolución de la diversidad de personas que las utiliza. Por lo tanto, si por un lado estamos rompiendo barreras de acceso tecnológicas, no tiene ningún sentido que por el otro levantemos de culturales o de lingüísticas.

La relación que desarrollamos con las máquinas llega a ser muy íntima, tanto, que el móvil duerme en la mesilla de noche y va al baño con nosotros

La relación que desarrollamos con las máquinas llega a ser muy íntima, tanto, que el móvil duerme en la mesilla de noche y va al baño con nosotros. Y las relaciones íntimas no son las mismas en una lengua que en otra. Estudios hechos con hablantes bilingües nativos de inglés-alemán demuestran que responden las preguntas de un test de manera diferente según si se hace en una lengua o en otra. La lengua con la que nos relacionamos nos define y es, por lo tanto, crítica a la hora de utilizarla con los asistentes de voz.

En cuanto al catalán, de momento ninguno de los asistentes de voz actuales lo soporta de manera nativa. A la Alexa de Amazon nos podemos dirigir en ocho lenguas, al Google Assistant en 12 y a la Siri de Apple en 21. Algunas de ellas como el danés, sueco, noruego o hebreo con menos hablantes que el catalán. Por lo tanto, no se trata de ninguna limitación tecnológica, ni política; es puramente una decisión empresarial: Google, Apple, Amazon o Microsoft, invertirán al desarrollar un modelo de lenguaje en el idioma de un mercado en función de los beneficios que los reporte. Está claro que tener la legislación de un estado o de una UE que los obligue a ofrecer sus servicios en las lenguas oficiales ayuda, pero no es el caso del catalán que no es lengua oficial en la UE. El segundo hándicap que tiene el catalán es que todos sus hablantes o bien sabemos también castellano o francés, dos lenguas globales las cuales están soportadas por todos los asistentes de voz.

No queda de otra que hacérnoslo nosotros mismos y es por eso que nació hace un par de años el proyecto AINA impulsado por la Generalitat de Catalunya. Durante este tiempo, el equipo de la Dra. Marta Villegas ha trabajado con el superordenador Mare Nostrum del Barcelona Super Computing Center en la creación del corpus y el modelo de lenguaje de la lengua catalana. El modelo se pondrá a disposición de empresas y organizaciones que quieran apoyar al catalán en sus productos o servicios basados en el lenguaje. Los resultados del AINA son aplicables a la traducción automática, los asistentes personales, la síntesis de voz, la clasificación e interpretación de textos entre otros.

Es importante que todas las hablas del dominio lingüístico queden grabadas si queremos que algún día las máquinas de casa nos puedan entender en nuestra lengua, en nuestro dialecto y en nuestro acento

Para que sea un buen modelo hace falta disponer de un corpus estructurado, diverso y de calidad de grabaciones de audio con sus correspondientes transcripciones. Cuanto más y más diverso mejor. Y es aquí donde todos podemos ayudar. La campaña que desde la vicepresidencia de la Generalitat ha empezado esta semana, anima a los hablantes de catalán a grabar nuestras voces en a plataforma de la fundación Mozilla Common Voice. Es importante que todas las hablas del dominio lingüístico queden grabadas si queremos que algún día las máquinas de casa nos puedan entender en nuestra lengua, en nuestro dialecto y en nuestro acento. Que no nos pase como estos escoceses que prueban de hacerse entender con el asistente de voz americano de un ascensor (si ponéis los subtítulos en inglés generados automáticamente por YouTube os daréis cuenta de la magnitud de la tragedia, ¡y esto que hablan inglés!).

La iniciativa parece llamada al éxito; ayer por la mañana estábamos al 1255% de las 1.200 grabaciones diarias que Common Voice se ha propuesto como hito. Tampoco es de extrañar en un país en el que la mitad son lingüistas de Twitter, la otra mitad viciados de Paraulògic y el 88% cree que los asistentes de voz tendrían que hablar también en catalán.