Acabem l’any amb una bona notícia per al català en el món digital, que és sens dubte un àmbit crucial per garantir la pervivència de la nostra llengua en un futur: la setmana passada el Govern va presentar el projecte Aina, que té com a objectiu generar conjunts ingents de textos (corpus) i models informàtics de la llengua catalana perquè les empreses que creen aplicacions basades en intel·ligència artificial puguin fer-ho fàcilment en català. Ens referim a aplicacions que ja estan presents en el nostre dia a dia, com ara els assistents de veu, els traductors automàtics o les cerques intel·ligents, però també a d’altres de més sofisticades, com les aplicacions de resum automàtic o les aplicacions per a l’anàlisi de sentiments, i també a d’altres que en aquest moment encara no existeixen ni ens podem imaginar, però que ben segur acabaran essent imprescindibles en les nostres vides. Tal com escrivia l’activista Àlex Hinojo en un tuit, sembla que hem obert definitivament el camí perquè pugui parlar en català amb la torradora, que no és una qüestió gens banal, ara que ja sabem que la interacció amb els sistemes digitals serà cada cop més en llenguatge natural i no mitjançant botons i menús com fins ara.
El primer recurs generat és un corpus del català per entrenar els algoritmes d’intel·ligència artificial, el més gran creat fins al moment en la nostra llengua, amb 1.770 milions de metadades associades a paraules. Ara caldrà crear nous corpus per incorporar les diferents variants dialectals del català, diferents registres lingüístics (col·loquial, literari, administratiu, etc.) i arxius de veu i imatge. Amb tota aquesta informació, el següent pas serà entrenar xarxes neuronals perquè “aprenguin el català” i generin models de la llengua, models de la parla i models per a la traducció.
Caldrà vetllar, és clar, perquè les màquines facin tot aquest aprenentatge en un català correcte. El nom del projecte, que és un homenatge a Aina Moll, primera directora general de Política Lingüística de la Generalitat i promotora de la mítica campanya El català és cosa de tots, que tenia com a imatge visible una noia que es deia Norma, fa pensar que serà així. Des d’un punt de vista terminològic, els 380.000 termes treballats pel TERMCAT fins al moment, i disponibles per mitjà del Cercaterm i l’Optimot, han de ser un punt de referència ineludible per assegurar que els diferents models seleccionen la terminologia adequada.
"Els 380.000 termes treballats pel TERMCAT fins al moment han de ser un punt de referència ineludible per assegurar que els diferents models seleccionen la terminologia adequada"
Queda molta feina per fer, doncs: la directora general de Societat Digital del Govern, Joana Barbany, va quantificar en 250.000 euros la inversió de la Generalitat feta fins ara en el projecte i va explicar que s'espera dotar-lo amb 12 milions d'euros més de fons europeus perquè creixi de manera progressiva en els pròxims tres anys.
Sembla, per tant, que l’argument del sobrecost adduït per la majoria d’empreses desenvolupadores per no introduir el català en els seus productes perdrà consistència. De tota manera, no cal esperar un camí de flors i violes. Com hem pogut veure en casos recents associats a la reproducció de continguts audiovisuals en català, la incorporació de la nostra llengua no és mai automàtica. Pot ser per motius polítics, per desconeixement de la realitat del país o senzillament per no assumir un cost addicional, per petit que sigui, per part de les empreses. O pot ser una barreja de tots tres motius.
Per això serà més important que mai que demostrem al mercat el nostre interès a consumir serveis i productes en català: convèncer-los que no ens és indiferent veure’ns obligats a emprar una altra llengua. Ha de quedar clar que, encara que entenguem el castellà –o el francès, els catalans del Nord–, per a nosaltres és un valor afegit transcendental el consum en la nostra llengua, que tindrem molt en compte a l’hora de seleccionar productes i serveis.
"La mateixa voluntat empresarial de personalitzar l’oferta i segmentar tant com sigui possible els usuaris ha de dur el mercat a facilitar-nos els serveis en la nostra llengua específica"
Com comentava Genís Roca, expert en Internet, en una taula rodona que va tenir lloc la setmana passada sobre el català com a llengua digital, organitzada pel Cercle Tecnològic de Catalunya (CTecno), caldrà que els que volem impulsar l’ús del català en el món tecnològic formem part d’alguns dels tres grups que ajuden l’activisme a assolir els seus objectius: el grup dels vigilants (s’està fent prou bé el que es fa?), el grup dels que molesten (per què no esteu fent-ho en català?) i el grup dels que proposen (com, de fet, ho ha estat ara el Govern amb aquest projecte, però també moltes altres iniciatives fomentades des del voluntariat, com –per dir-ne un sol exemple rellevant– les de Softcatalà). De fet, la mateixa voluntat empresarial de personalitzar l’oferta i segmentar tant com sigui possible els usuaris ha de dur el mercat a facilitar-nos els serveis en la nostra llengua específica. Tot i això, com el mateix Genís Roca aventurava, deu anys de transició perquè les empreses entenguin que els és més rendible servir-nos en català, no ens els traurà ningú.
Per això són tan importants també altres iniciatives complementàries, com la de Canal Malaia, un grup de joves youtubers catalans que promouen una cosa tan simple com utilitzar a les xarxes la mateixa llengua que utilitzen en la intimitat. Com comentava en la mateixa taula rodona esmentada la youtubera Gal·la Martí, que se suma també a aquesta iniciativa, això no hauria de ser considerat activisme, sinó normalitat. Malauradament, si ser un ciutadà digital conscienciat ja sol ser cansat (cal tenir els ulls oberts en molts camps: pensem, sense anar més lluny, en el tema de la privadesa de dades), ser un ciutadà català conscienciat és doblement cansat. Esperem que en un futur les tecnologies ens ajudin que no ho sigui tant.