Comptar el nombre de persones d'una manifestació o de grans aglomeracions en espais oberts no és una tasca fàcil i segons les metodologies emprades fins ara les xifres poden variar substancialment. Els investigadors Xialei Liu i Joost Van de Weijer, del Centre de Visió per Computador (CVC) de la Universitat Autònoma de Barcelona i la Universitat de Florència han desenvolupat un algorisme que fa servir tècniques de visió artificial per poder estimar el nombre de persones en imatges amb una franja d’error entre un 10% i un 20%, la més baixa aconseguida fins ara dins d’aquest àmbit.
Jordi Puigneró, secretari de Telecomunicacions, Ciberseguretat i Societat Digital i president del CVC, ha assegurat que amb aquesta tecnologia es poden acabar ''les controvèrsies i les manipulacions'' que es produeixen molts cops quan s'ha comptabilitzar el nombre de persones que han assistit en una manifestació.
Josep Lladós, director del CVC, ha destacat que aquest centre de la UAB és un referent internacional en la visió artificial. La nova tecnologia que han desenvolupat amb la Universitat de Florència la presentaran les pròximes setmanes en el món universitari internacional de la realidad virtual.
La franja d'error per comptabilitzar el nombre de persones en una aglomeració és entre el 10% i el 20%, la més baixa que es coneix fins ara
Es tracta d'un software generat en l'àrea de la vídeo seguretat, monitoratge o anàlisi de comportament. Fins ara, la problemàtica científica era evident: distorsions de perspectiva, distribució desigual, il·luminació complexa, variació d'escales feien que els algorismes de visió artificial no poguessin ser capaços de comptar números de caps dins d’una imatge. Els investigadors del Centre de Visió per Computador han aconseguit per fi un algorisme estable fent ús de mapes de densitat, que ajuden a eliminar la majoria d’aquestes distorsions.
Ensenyar als ordinadors a comptar grans aglomeracions necessita imatges que hagin estat tractades per un humà. Aquest és el qui li diu a l'ordinador què hi ha dins de cada píxel (com un mestre quan ensenya a un nen una matèria que mai ha cursat). Van de Weijer i el seu equip eliminen aquesta variable, fent el procés molt més ràpid i econòmic ensenyant als ordinadors a comparar imatges.
El procés és relativament senzill, però complex en la pràctica: se li dóna a l’ordinador una primera imatge, i després se li donen retalls d'aquesta. Llavors, l'ordinador ha d'aprendre que hi ha menys gent en la segona fotografia (la retallada) que en la primera (l'original). Aquesta tècnica, afinada, és la base de l'aprenentatge d’aquest nou algorisme.
Lladós ha explicat que es tracta d'una nova eina que pot comptabilitzar persones en una manifestació amb molta exactitud i que vol ser útil per un futur, sense posar en entredit els nombres de persones que han assistit a grans manifestacions que han quedat com referents amb la història d'un país.
Lladós també ha destacat que al treballar amb imatges, la tecnologia d'aquest lector virtual també pot ser útil en la medicina, per comptar per exemple nombre de espermatozoides, o per fer un inventari del magatzem d'una empresa.