Extinción digital

19 de Noviembre de 2020
Act. 19 de Noviembre de 2020
Josep Maria Ganyet | VIA Empresa

Vía un tweet del director del BSC Pep Martorell aprendo el concepto de "extinción digital", el fenómeno que se produce cuando una lengua se convierte en irrelevante en el ámbito de las comunicaciones digitales, que equivale a su desaparición efectiva. Si fuera anglófono o hispanófono habría pasado de largo, siendo catalán, por lo tanto filólogo, meteorólogo y entrenador del Barça, me tiro de cabeza. El mismo Pep me pasa un par de enlaces a la web de META-NET sobre el tema. (Key Results and Cross-Language Comparison, La lengua catalana a la era digital).

META-NET (Multilingual Europe Technology Alliance) es una red de excelencia financiada por la Comisión Europea, compuesta de 54 centros de investigación de 33 países. Reúne a investigadores, proveedores de tecnología, usuarios públicos y privados, profesionales de la lengua, entre otros actores de la sociedad de la información. Su misión es impulsar las tecnologías del lenguaje para que se haga realidad una Europa unida en un solo mercado y en un solo espacio informacional. Un mercado donde alguien de Tàrrega quiera contratar un seguro en Berlín y tenga que recurrir al inglés para hacerlo no garantiza la igualdad de competencia y, por lo tanto, dista mucho de ser único. En esto las tecnologías del lenguaje nos pueden ayudar.

Las tecnologías del lenguaje son aquellas que posibilitan las relaciones con el lenguaje natural entre humanos y máquinas y entre humanos vía máquinas. Confluyen la lingüística y la computación y hacen que los ordenadores sean competentes en el análisis, la interpretación y la producción de lenguaje, sea escrito o hablado, en el sentido humano máquina y en el contrario. Las utilizamos constantemente sin darnos cuenta cada vez que hacemos una búsqueda en Google, cuando pasamos el corrector a un texto, cuando utilizamos una herramienta de traducción automática, cuando seguimos las indicaciones habladas de un GPS o cuando le decimos a un asistente de voz que nos busque todas las películas de Sean Connery en Filmen. Ulysses, mi procesador de textos de cabecera, analiza este artículo mientras lo estoy escribiendo, me cuenta los caracteres, me dice el tiempo de lectura y me corrige las palabras mal escritas.

¿Pueden las tecnologías del lenguaje hacer realidad la visión de un mercado único real con las 80 lenguas europeas actuales? ¿Cómo afecta a las lenguas minoritarias pero con buena salud digital como el catalán? ¿Podrá Àlex Hinojo finalmente hablar en catalán con su tostadora?

Las tecnologías del lenguaje pueden hacer que la traducción automática, la producción de contenidos y la gestión del conocimiento sean posibles para todas las lenguas de Europa, incluso para las que como el lituano, el serbio o el islandés están en una situación digital débil (más que el catalán). Estas tecnologías pueden facilitar el desarrollo de interfaces de voz para el uso de electrodomésticos, vehículos y ordenadores en general. El último ejemplo lo encontramos en Tesla que incorpora su interfaz en catalán (SEAT, ¿nos tenéis que decir algo?).

"¿Pueden las tecnologías del lenguaje hacer realidad la visión de un mercado único real con las 80 lenguas europeas actuales?"

Que se desarrollen estas tecnologías no sólo es crucial para la supervivencia digital de las lenguas no mayoritarias, lo es para su supervivencia en todos los ámbitos. META-NET ha estudiado la situación de las lenguas europeas en cuanto a las tecnologías del lenguaje; traducción máquina, procesamiento del habla, análisis de texto y recursos disponibles. En todas estas disciplinas, el inglés es el que está en solitario en el grupo de lenguas que tienen un buen apoyo en todos los ámbitos. En cuanto a la traducción máquina, francés y español disfrutan de un apoyo moderado mientras que el catalán se sitúa en el grupo de lenguas que tienen un apoyo parcial junto con el holandés, el alemán, el húngaro, el italiano, el polaco y el rumano. Lenguas como el vasco, noruego, el sueco, danés, el islandés o el griego están en el grupo de apoyo débil, detrás del catalán. En todos los otros ámbitos el catalán tiene apoyo parcial junto con lenguajes europeos de número de hablantes similar.

A menudo hemos comparado el impacto de la revolución digital actual con la llegada de la imprenta en cuanto a la posibilidad exponencial de diseminación del conocimiento y su impacto en la sociedad. La llegada de la nueva tecnología de la información y comunicación de Gutenberg propició una estandarización ortográfica y gramatical de las lenguas más habladas que permitió una difusión más eficiente de las nuevas ideas científicas e intelectuales. Pero esto fue a expensas de la supervivencia de las lenguas minoritarias; muchas lenguas con poco peso específico como el córnico o el dálmata se quedaron en las tecnologías de la información orales y acabaron desapareciendo. La tecnología no da nada gratis.

Mirar al pasado no sirve para predecir el futuro pero sí para saber cuál es el futuro que no queremos. El futuro se crea con cada interacción entre personas, con cada intercambio de ideas, y de manera análoga, con cada interacción con una máquina; con los tweets, con la lengua en que hablamos a nuestro móvil, en el idioma en que tenemos configurado el navegador y las instrucciones que le damos al coche o a la tele. Los pequeños cambios son poderosos, que decía el Capitán Enciam; en un entorno digital, exponencialmente poderosos, que diría Moore.