Acabamos el año con una buena noticia para el catalán en el mundo digital, que es sin duda un ámbito crucial para garantizar la pervivencia de nuestra lengua en un futuro: la semana pasada el Govern presentó el proyecto Aina, que tiene como objetivo generar conjuntos ingentes de textos (corpus) y modelos informáticos de la lengua catalana para que las empresas que crean aplicaciones basadas en inteligencia artificial puedan hacerlo fácilmente en catalán. Nos referimos a aplicaciones que ya están presentes en nuestro día a día, como por ejemplo los asistentes de voz, los traductores automáticos o las buscadores inteligentes, pero también a otros más sofisticados, como las aplicaciones de resumen automático o las aplicaciones para el análisis de sentimientos, y también a otros que en este momento todavía no existen ni nos podemos imaginar, pero que bien seguro acabarán siendo imprescindibles en nuestras vidas. Tal como escribía el activista Àlex Hinojo en un tuit, parece que hemos abierto definitivamente el camino para que pueda hablar en catalán con la tostadora, que no es una cuestión nada banal, ahora que ya sabemos que la interacción con los sistemas digitales será cada vez más en lenguaje natural y no mediante botones y menús como hasta ahora.
El primer recurso generado es un corpus del catalán para entrenar los algoritmos de inteligencia artificial, el más grande creado hasta el momento en nuestra lengua, con 1.770 millones de metadatos asociados a palabras. Ahora habrá que crear nuevos corpus para incorporar las diferentes variantes dialectales del catalán, diferentes registros lingüísticos (coloquial, literario, administrativo, etc.) y archivos de voz e imagen. Con toda esta información, el siguiente paso será entrenar redes neuronales para que "aprendan el catalán" y generen modelos de la lengua, modelos del habla y modelos para la traducción.
Habrá que velar, está claro, para que las máquinas hagan todo este aprendizaje en un catalán correcto. El nombre del proyecto, que es un homenaje a AinaMoll, primera directora general de Política Lingüística de la Generalitat y promotora de la mítica campaña El catalán es cosa de todos, que tenía como imagen visible a una chica que se llamaba Norma, hace pensar que será así. Desde un punto de vista terminológico, los 380.000 termas trabajados por el TERMCAT hasta el momento, y disponibles por medio del Cercaterm y el Optimot, tienen que ser un punto de referencia ineludible para asegurar que los diferentes modelos seleccionan la terminología adecuada.
"Los 380.000 termas trabajados por el TERMCAT hasta el momento tienen que ser un punto de referencia ineludible para asegurar que los diferentes modelos seleccionan la terminología adecuada"
Queda mucho trabajo por hacer, pues: la directora general de Societat Digital del Govern, Joana Barbany, cuantificó en 250.000 euros la inversión de la Generalitat hecha hasta ahora en el proyecto y explicó que se espera dotarlo con 12 millones de euros más de fondos europeos porque crezca de manera progresiva en los próximos tres años.
Parece, por lo tanto, que el argumento del sobrecoste aducido por la mayoría de empresas desarrolladoras para no introducir el catalán en sus productos perderá consistencia. De todas maneras, no hay que esperar un camino de rosas. Como hemos podido ver en casos recientes asociados a la reproducción de contenidos audiovisuales en catalán, la incorporación de nuestra lengua no es nunca automática. Puede ser por motivos políticos, por desconocimiento de la realidad del país o sencillamente para no asumir un coste adicional, por pequeño que sea, por parte de las empresas. O puede ser una mezcla de los tres motivos.
Por eso será más importante que nunca que demostremos al mercado nuestro interés a consumir servicios y productos en catalán: convencerlos de que no nos es indiferente vernos obligados a emplear otra lengua. Tiene que quedar claro que, aunque entendamos el castellano –o el francés, los catalanes norteños–, para nosotros es un valor añadido trascendental el consumo en nuestra lengua, que tendremos mucho en cuenta a la hora de seleccionar productos y servicios.
"La misma voluntad empresarial de personalizar la oferta y segmentar tanto como sea posible los usuarios tiene que llevar al mercado a facilitarnos los servicios en nuestra lengua específica"
Como comentaba Genís Roca, experto en Internet, en una mesa redonda que tuvo lugar la semana pasada sobre el catalán como lengua digital, organizada por el Círculo Tecnológico de Catalunya (CTecno), hará falta que los que queremos impulsar el uso del catalán en el mundo tecnológico formamos parte de algunos de los tres grupos que ayudan el activismo a lograr sus objetivos: el grupo de los vigilantes (¿se está haciendo bastante bien lo que se hace?), el grupo de los que molestan (¿por qué no estáis haciéndolo en catalán?) y el grupo de los que proponen (cómo, de hecho, lo ha sido ahora el Govern con este proyecto, pero también otras muchas iniciativas fomentadas desde el voluntariado, como –para decir un solo ejemplo relevante– las de Softcatalà). De hecho, la misma voluntad empresarial de personalizar la oferta y segmentar tanto como sea posible a los usuarios tiene que llevar al mercado a facilitarnos los servicios en nuestra lengua específica. Aún así, como el mismo Genís Roca aventuraba, diez años de transición para que las empresas entiendan que les es más rentable servirnos en catalán, no nos los sacará nadie.
Por eso son tan importantes también otros iniciativas complementarias, como la de Canal Malaia, un grupo de jóvenes youtubers catalanes que promueven una cosa tan simple como utilizar en las redes la misma lengua que utilizan en la intimidad. Como comentaba en la misma mesa redonda mencionada la youtubera Gal·la Martí, que se suma también a esta iniciativa, esto no tendría que ser considerado activismo, sino normalidad. Desgraciadamente, si ser un ciudadano digital concienciado ya suele ser cansado (hay que tener los ojos abiertos en muchos campos: pensamos, sin ir más lejos, en el tema de la privacidad de datos), ser un ciudadano catalán concienciado es doblemente cansado. Esperamos que en un futuro las tecnologías nos ayuden a que no lo sea tanto.