Los datos o las haces o te las hacen. La información que generamos en nuestro tránsito por entornosdigitales y físicos en el día a día marcará nuestras vidas – las ofertas que recibimos, los trabajos que podemos encontrar, nuestra relación con las empresas – lo sepamos o no, lo controlemos o no. Lo que los anglosajones denominan dataliteracy – alfabetización de datos, esencialmente el conocimiento de cómo nos afecta y que hacer con este petróleodigital – acontecerá esencial en un mundo estructurado alrededor de algoritmos, inteligencia artificial y Big Fecha. Pero para correr, tenemos que aprender a andar antes, y las herramientas para hacerlo no están al alcance de todo el mundo. "Hay una literatura de datos que no está muy traducida al plano mundano", avisa Fernando de la Rosa, empresario del sector edtech – fundó la empresa de contenidos educativos, learninganalytics y SaaS Foxsize – y autor de Data: Cómo los datos te ayudarán en tú vida y en tú empresa (2022).
¿Cómo podemos operar en el mundo del machine learning, cómo podemos gestionar el stock masivo de datos que producimos, cómo podemos guardar nuestra privacidad y soberanía digital, pues, si todavía usamos la media para representar un abanico numérico, y no la moda? Es cierto que, como apunta el mismo De la Rosa en la presentación de su libro al Pier01 de TechBarcelona "a todos nos lama El Dorado". Las megacorporacions tecnológicas como Google sacan millones en ingresos de los datos que recaudan de sus usuarios, y esta enorme relevancia entre las compañías que medien nuestra relación con los entornos digitales hace que se intente acelerar la conversación. Nuestras necesidades, pero, son mucho más humildes.
De la Rosa: "Un dato no habla, o la interpretas o no sirve para nada. El dato muestra, no demuestra"
Nuestras actividades diarias siempre han sido una fuente de información. Las facilidades tecnológicas para su recaudación, conservación y análisis es el que los convierten en la mercancía más buscada. Aún así, por sí misma, un dato tiene un valor escaso. El dato es la materia primera que, con una buena lectura, puesta en contexto, en combinación con más información, es esencial para la implementación de cualquier proceso, pero una mala gestión de los datos puede ser contraproducente. La concepción que los datos hablan por sí mismos, muy extendida en el sentido común tecnológico, es radicalmente falsa. "Un dato no habla, o la interpretas o no sirve para nada. El dato muestra, no demuestra". Y la falta de formación básica en su captación, pero especialmente en su lectura, puede llevarnos a "tomar malas decisiones".
Uno de los grandes riesgos de la lectura de datos es el sesgo de confirmación. De la Rosa subraya nuestra tendencia a "dejarnos guiar por un dato que sea cómodo, que confirme una preconcepción anterior". Siempre puede haber, de hecho, datos que aisladas de su contexto puedan servir para explicar razonamientos diferentes, contrarios entre ellos a veces. Esto no socava, sin embargo, el valor del dato como materia primera de la investigación en entornos digitales. Más bien al contrario, demuestra la necesidad de hacer un trabajo extensivo, que la ponga en contexto. Un trabajo que nos haga transitar, cómo mapeja acertadamente el autor, "del dato a la información; de la información al conocimiento y del conocimiento a la sabiduría".
Datos y empresa
Lo primero que tiene que admitir el tejido empresarial es la ubicuidad de los datos. En el mundo de la transición digital, ningún proyecto de valor se puede gestionar sin tenerlos en cuenta – hacerlo los pone, de hecho, en un riesgo casi existencial. "No hay ninguna empresa en la actualidad que no tenga un problema de datos; y si no lo tiene, es que está absolutamente fuera de juego", razona el autor. Un golpe se acepta esto, se tiene que entender, como empresario, una segunda cuestión: el discurso tecnológico tiende hacia la grandilocuencia, pero las necesidades del tejido empresarial transitan a menudo carreteras muy diferentes. "Muchas empresas afirman que hacen proyectos de Big Data, pero en realidad no es así – explica De la Rosa – bastante tenemos con entender y segmentar datos para escalar". Data sirve también de glosario, de libro de texto, porque usuarios y empresarios tengan la base conceptual para hablar con propiedad del que hacen, el que necesitan y el que proyectan de la mano de los datos.
De la Rosa usa el ejemplo de un parque de atracciones que, hace más de década y media, implementó un sistema datadriven alrededor de un indicador core que los permitía prever los resultados de cada día de actividad y actuar según las necesidades que se expresaban. Con un modelo matemático, la empresa descubre que las entradas en el parque entre la primera hora y las 10 de la mañana marcarán los resultados de la jornada. Mediante un sistema de encuestadores, recaudan datos sobre los perfiles y la procedencia de los clientes, y cruzando las informaciones recaudadas, tienen suficiente conocimiento para proyectar las tendencias del negocio y programar con un nivel de certeza razonable las actividades de las siguientes semanas. "Alguien tuvo una visión, se hace un modelo predictivo y se avanza de acuerdo con el dato", identifica De la Rosa. Este – con más tecnología, y, por lo tanto, más capacitado – es el proceso, nada más y nada menos.
En cuanto al proceso de adaptación hacia un modelo datadriven, el autor detecta un exceso de concentración en las herramientas de recogida y gestión de datos; en detrimento de su interpretación y puesta en contexto. "Hoy en día, la aproximación de las empresas a los datos va más de tools que de thinking – alerta De la Rosa – cuando la gestión de datos va más de thinking que de tools". El pensamiento alrededor del dato permite extraer tendencias, intencionalidades, acercar la información a las realidades observadas y gestionarlas correctamente. Data deviene, así, una hoja de ruta entendedora que permite una primera aproximación más que solvente en el mundo de los datos, un solo umbral para las múltiples puertas de la gestión de la información en los espacios digitales. Antes de correr, otra vez, andar: "Buenos datos son mejor que muchos; toca pensar, capturar, y usar datos de calidad", concluye el autor.