Etnògraf digital

Tots els accents de l’AINA

17 de Febrer de 2022
Josep Maria Ganyet | VIA Empresa

Mon fill parla català amb accent de Lleida amb mi, de Barcelona al poble del Maresme on vivim i catanyol a l’institut. Amb sa mare parla italià amb accent del sud i de tant en tant deixa anar alguna frase en napolità. I com que l’Alexa de la cuina el tenim configurant en anglès i italià a casa parlem indistintament català, italià i anglès depenent de qui iniciï la conversa o a qui vagi dirigida.

 

No som un cas tan estrany; el 60% de la població mundial parla més d'una llengua de manera fluida i d'aquests, un 13% en parla tres. Només un 40% de la gent és monolingüe. Estadísticament, es demostra que els parlants de llengües majoritàries tenen poc interès a aprendre una segona llengua, ja que tenen la percepció que la resta del món ja parla la seva.

Potser la cosa que resulti més estranya del nostre ambient lingüístic casolà és el fet que amb els robots de casa —això inclou la Roomba— hi parlem en anglès. No ens és una llengua estranya en entorns de feina o de lleure (penseu en Netflix) però sí que ho és en un entorn familiar. La causa de la presència quotidiana de l’anglès és que l’Alexa —i la resta d’assistents de mòbils o de dispositius— no entenen el català. La decisió de configurar l’Alexa en anglès va ser tripartida: 1) funciona millor en anglès que en qualsevol altra llengua, 2) ens permet practicar la llengua de James Gandolfini i 3) la configuració en anglès dels EUA té una versió italo-americana que permet la interacció en anglès i italià alhora. Els diàlegs amb l’Alexa de la cuina podrien sortir als Soprano.

 

Si per una banda estem trencant barreres d'accés tecnològiques, no té cap sentit que per l'altra n'aixequem de culturals o de lingüístiques

Els ordinadors han passat en poc més de 60 anys d’ocupar plantes senceres d’empreses i universitats a cabre al palmell de la mà. Un mòbil d’avui té la potència de càlcul d’un superordinador de fa 25 anys: a cada generació els ordinadors són més petits i la seva tendència natural és a la desaparició. Els assistents de veu són els primers passos del que anomenem computació ambiental: ordinadors invisibles amb els quals interactuem de manera natural. I la manera més natural que tenim les persones d’interactuar és la parla.

Els primers ordinadors només estaven a l'abast d'enginyers que els programaven durant setmanes canviant-ne físicament el cablejat. Avui qualsevol pot editar un vídeo a 4k en un telèfon mòbil només fent anar un dit. Més gent ha entrat a la computació els darrers deu anys de la mà de les videoconferències al mòbil que en els darrers 60 anys. A cada nova generació hem tingut més ordinadors, més ràpids i més gent els ha utilitzat. Podríem resumir l'evolució de la interacció amb ordinadors en: cables, targetes perforades, línies de comandes, ratolí, dit i veu. L'evolució de les interfícies és també l'evolució de la diversitat de persones que les utilitza. Per tant, si per una banda estem trencant barreres d'accés tecnològiques, no té cap sentit que per l'altra n'aixequem de culturals o de lingüístiques.

La relació que desenvolupem amb les màquines arriba a ser molt íntima, tant, que el mòbil dorm a la tauleta de nit i va al bany amb nosaltres

La relació que desenvolupem amb les màquines arriba a ser molt íntima, tant, que el mòbil dorm a la tauleta de nit i va al bany amb nosaltres. I les relacions íntimes no són les mateixes en una llengua que en una altra. Estudis fets amb parlants bilingües nadius d’anglès-alemany demostren que responen les preguntes d’un test de manera diferent segons si es fa en una llengua o en una altra. La llengua amb la qual ens relacionem ens defineix i és, per tant, crítica a l’hora d’utilitzar-la amb els assistents de veu.

Pel que fa al català, de moment cap dels assistents de veu actuals el suporta de manera nativa. A l’Alexa d’Amazon ens hi podem dirigir en vuit llengües, al Google Assistant en 12 i a la Siri d’Apple en 21. Algunes d’elles com el danès, suec, noruec o hebreu amb menys parlants que el català. Per tant, no es tracta de cap limitació tecnològica, ni política; és purament una decisió empresarial: Google, Apple, Amazon o Microsoft, invertiran en desenvolupar un model de llenguatge en l’idioma d’un mercat en funció dels beneficis que els reporti. És clar que tenir la legislació d’un estat o d’una UE que els obligui a oferir els seus serveis en les llengües oficials hi ajuda, però no és el cas del català que no és llengua oficial a la UE. El segon hàndicap que té el català és que tots els seus parlants o bé sabem també castellà o francès, dues llengües globals les quals estan suportades per tots els assistents de veu.

No en queda d’altra que fer-nos-ho nosaltres mateixos i és per això que va néixer fa un parell d’anys el projecte AINA impulsat per la Generalitat de Catalunya. Durant aquest temps, l’equip de la Dra. Marta Villegas ha treballat amb el superordinador Mare Nostrum del Barcelona Super Computing Center en la creació del corpus i el model de llenguatge de la llengua catalana. El model es posarà a disposició d’empreses i organitzacions que vulguin donar suport al català en els seus productes o serveis basats en el llenguatge. Els resultats de l’AINA són aplicables a la traducció automàtica, els assistents personals, la síntesi de veu, la classificació i interpretació de textos entre altres. 

És important que tots els parlars del domini lingüístic hi quedin enregistrats si volem que algun dia les màquines de casa ens puguin entendre en la nostra llengua, en el nostre dialecte i en el nostre accent

Perquè sigui un bon model cal disposar d’un corpus estructurat, divers i de qualitat d’enregistraments d’àudio amb les seves corresponents transcripcions. Com més i més divers millor. I és aquí on tots hi podem ajudar. La campanya que des de vicepresidència de la Generalitat ha començat aquesta setmana, anima als parlants de català a enregistrar les nostres veus a la plataforma de la fundació Mozilla Common Voice. És important que tots els parlars del domini lingüístic hi quedin enregistrats si volem que algun dia les màquines de casa ens puguin entendre en la nostra llengua, en el nostre dialecte i en el nostre accent. Que no ens passi com a aquests escocesos que proven de fer-se entendre amb l’assistent de veu americà d’un ascensor (si poseu els subtítols en anglès generats automàticament per YouTube us adonareu de la magnitud de la tragèdia, i això que parlen anglès!).

La iniciativa sembla cridada a l’èxit; ahir al matí estàvem al 1255% dels 1.200 enregistraments diaris que Common Voice s’ha proposat com a fita. Tampoc no és d’estranyar en un país on la meitat són lingüistes de Twitter, l’altra meitat viciats de Paraulògic i el 88% creu que els assistents de veu haurien de parlar també en català.