El món de la gestió de les dades té una importància cada cop més gran en la nostra societat i això comporta l'aparició constant de noves realitats d'aquest àmbit (noves disciplines, nous mètodes, etc.) i, per tant, també l'aparició constant de nous termes per a designar-les. Així, a conceptes ja coneguts o tradicionals, com ara recollida de dades, base de dades, gestió de dades o anàlisi de dades, se n’han afegit en poc temps molts d’altres, especialment relacionats amb allò que s’anomena el big data.
Aquesta forma d’origen anglès, big data, s’ha incorporat oficialment a la nostra llengua fa poc, al costat del sinònim dades massives, que ja es difonia. Podeu pronunciar big data a la catalana: big, amb oclusiva final, com càstig, i data, tal com sona (tingueu present, de fet, que data és un llatinisme de l’anglès, concretament el plural de datum, això és, dada).
Malgrat el plural originari de data, big data s’utilitza majoritàriament en anglès i en la majoria de llengües romàniques com a forma singular i, en català, en masculí: el big data. Es refereix a un volum de dades molt gran, de procedència diversa (publicacions electròniques, xarxes socials, bases de dades, empreses, organismes públics, etc.) i de característiques també diverses (text, àudio, vídeo, etc.), que va augmentant contínuament a una gran velocitat i que, justament per aquestes característiques (les anomenades tres ves: varietat, volum creixent i velocitat de generació), només es pot emmagatzemar i gestionar amb l’ajuda d’eines informàtiques específiques. L’àmbit de la informàtica que s’ocupa del desenvolupament d’eines i sistemes per al tractament d’aquestes dades també se sol anomenar, per extensió, big data.
Aquesta immensitat de dades complexes i sovint no estructurades, que d’entrada pot suggerir una mena de caos ingovernable, resulta, en canvi, de gran valor i utilitat per a les empreses i altres organismes quan es gestiona i s’analitza bé, d’acord amb els objectius de cada lloc. Pot ser cabdal per a la presa de decisions, la millora de l’eficiència, el desenvolupament de nous productes, l’avenç científic, etc. És per això que ha sorgit la ciència de dades (de l’anglès data science), també anomenada datologia en català, que és la disciplina que s’ocupa de l'extracció, la gestió, l'explotació, l'anàlisi i la interpretació de les dades, amb l’objectiu d’obtenir-ne informació i coneixement. Elsespecialistes en ciència de dades, o datòlegs, utilitzen mètodes procedents de les matemàtiques, l’estadística, la informàtica i altres àmbits d’estudi per a dur a terme la seva feina, i recorren a eines com ara la mineria de dades, l’aprenentatge automàtic (machine learning, en anglès) o els algorismes d’intel·ligència artificial.
Un altre concepte sorgit o impulsat arran de l’eclosió del big data és, per exemple, la governança de dades, que no és altra cosa que la política de gestió integral de les dades d’una organització, destinada a assegurar la disponibilitat, la usabilitat, la consistència, la integritat i la seguretat de les dades. La persona que s’encarrega d’implementar la governança de dades en una organització és el coordinador de dades (o la coordinadora de dades), conegut en anglès amb la forma data steward, una nova figura professional a la qual s’uneix també el custodi de dades (o la custòdia de dades), en anglès data custodian, que s’encarrega de regular l’accés a les dades i de mantenir-ne la integritat i la seguretat, sempre d’acord amb les directrius del coordinador de dades.
Aquests són només alguns dels nous conceptes relacionats amb aquest actiu tan important que són les dades i la seva gestió. Els trobareu tots, i molts d’altres de relacionats, al Cercaterm.