Les dades o les fas o te les fan. La informació que generem en el nostre trànsit per entorns digitals i físics en el dia a dia marcarà les nostres vides – les ofertes que rebem, les feines que podem trobar, la nostra relació amb les empreses – ho sapiguem o no, ho controlem o no. El que els anglosaxons denominen data literacy – alfabetització de dades, essencialment el coneixement de com ens afecta i què fer amb aquest petroli digital – esdevindrà essencial en un món estructurat al voltant d'algorismes, intel·ligència artificial i Big Data. Però per córrer, hem d'aprendre a caminar abans, i les eines per a fer-ho no estan a l'abast de tothom. "Hi ha una literatura de dades que no està ben traduïda al plànol mundà", avisa Fernando de la Rosa, empresari del sector edtech – va fundar l'empresa de continguts educatius, learning analytics i SaaS Foxsize – i autor de Data: Cómo los datos te ayudarán en tu vida y en tu empresa (2022).
Com podem operar en el món del machine learning, com podem gestionar l'stock massiu de dades que produïm, com podem guardar la nostra privacitat i sobirania digital, doncs, si encara fem servir la mitjana per representar un ventall numèric, i no la moda? És cert que, com apunta el mateix De la Rosa en la presentació del seu llibre al Pier01 de Tech Barcelona "a tots ens crida El Dorado". Les megacorporacions tecnològiques com Google treuen milions en ingressos de les dades que recapten dels seus usuaris, i aquesta enorme rellevància entre les companyies que medien la nostra relació amb els entorns digitals fa que s'intenti accelerar la conversa. Les nostres necessitats, però, són molt més humils.
De la Rosa: "Una dada no parla, o la interpretes o no serveix per res. La dada mostra, no demostra"
Les nostres activitats diàries sempre han estat una font d'informació. Les facilitats tecnològiques per a la seva recaptació, conservació i anàlisi és el que els converteixen en la mercaderia més buscada. Tot i això, per si mateixa, una dada té un valor escàs. La dada és la matèria primera que, amb una bona lectura, posada en context, en combinació amb més informació, és essencial per a la implementació de qualsevol procés, però una mala gestió de les dades pot ser contraproduent. La concepció que les dades parlen per si mateixes, molt estesa en el sentit comú tecnològic, és radicalment falsa. "Una dada no parla, o la interpretes o no serveix per res. La dada mostra, no demostra". I la manca de formació bàsica en la seva captació, però especialment en la seva lectura, pot portar-nos a "prendre males decisions".
Un dels grans riscos de la lectura de dades és el biaix de confirmació. De la Rosa subratlla la nostra tendència a "deixar-nos guiar per una dada que sigui còmoda, que confirmi una preconcepció anterior". Sempre pot haver-hi, de fet, dades que aïllades del seu context puguin servir per explicar raonaments diferents, contraris entre ells de vegades. Això no soscava, però, el valor de la dada com a matèria primera de la recerca en entorns digitals. Ans al contrari, demostra la necessitat de fer-ne un treball extensiu, que la posi en context. Un treball que ens faci transitar, com mapeja encertadament l'autor, "de la dada a la informació; de la informació al coneixement i del coneixement a la saviesa".
Dades i empresa
El primer que ha d'admetre el teixit empresarial és la ubiqüitat de les dades. En el món de la transició digital, cap projecte de valor es pot gestionar sense tenir-les en compte – fer-ho el posa, de fet, en un risc gairebé existencial. "No hi ha cap empresa en l'actualitat que no tingui un problema de dades; i si no el té, és que està absolutament fora de joc", raona l'autor. Un cop s'accepta això, s'ha d'entendre, com a empresari, una segona qüestió: el discurs tecnològic tendeix cap a la grandiloqüència, però les necessitats del teixit empresarial transiten sovint carreteres molt diferents. "Moltes empreses afirmen que fan projectes de Big Data, però en realitat no és així – explica De la Rosa – prou tenim amb entendre i segmentar dades per escalar". Data serveix també de glossari, de llibre de text, perquè usuaris i empresaris tinguin la base conceptual per parlar amb propietat del que fan, el que necessiten i el que projecten de la mà de les dades.
De la Rosa fa servir l'exemple d'un parc d'atraccions que, fa més de dècada i mitja, va implementar un sistema data driven al voltant d'un indicador core que els permetia preveure els resultats de cada dia d'activitat i actuar segons les necessitats que s'hi expressaven. Amb un model matemàtic, l'empresa descobreix que les entrades al parc entre la primera hora i les 10 del matí marcaran els resultats de la jornada. Mitjançant un sistema d'enquestadors, recapten dades sobre els perfils i la procedència dels clients, i creuant les informacions recaptades, tenen prou coneixement per projectar les tendències del negoci i programar amb un nivell de certesa raonable les activitats de les següents setmanes. "Algú va tenir una visió, es fa un model predictiu i s'avança d'acord amb la dada", identifica De la Rosa. Aquest – amb més tecnologia, i, per tant, més capacitat – és el procés, ni més ni menys.
Pel que fa al procés d'adaptació cap a un model data driven, l'autor detecta un excés de concentració en les eines de recollida i gestió de dades; en detriment de la seva interpretació i posada en context. "Avui dia, l'aproximació de les empreses a les dades va més de tools que de thinking – alerta De la Rosa – quan la gestió de dades va més de thinking que de tools". El pensament al voltant de la dada permet extreure tendències, intencionalitats, apropar la informació a les realitats observades i gestionar-les correctament. Data esdevé, així, un full de ruta entenedor que permet una primera aproximació més que solvent al món de les dades, un sol llindar per a les múltiples portes de la gestió de la informació en els espais digitals. Abans de córrer, un altre cop, caminar: "Bones dades són millor que moltes; toca pensar, capturar, i fer servir dades de qualitat", conclou l'autor.