Contar el número de personas de una manifestación o de grandes aglomeraciones en espacios abiertos no es una tarea fácil y según las metodologías empleadas hasta ahora las cifras pueden variar sustancialmente. Los investigadores Xialei Liu y Joost Van de Weijer, del Centro de Visión por Computador (CVC) de la Universitat Autònoma de Barcelona y la Universidad de Florencia han desarrollado un algoritmo que usa técnicas de visión artificial para poder estimar el número de personas en imágenes con una franja de error entre un 10% y un 20%, la más baja conseguida hasta ahora dentro de este ámbito.
Jordi Puigneró, secretario de Telecomunicaciones, Ciberseguretat y Sociedad Digital y presidente del CVC, ha asegurado que con esta tecnología se pueden acabar ''las controversias y las manipulaciones'' que se producen muchos golpes cuando se ha contabilizar el número de personas que han asistido en una manifestación.
Josep Lladós, director del CVC, ha destacado que este centro de la UAB es un referente internacional en la visión artificial. La nueva tecnología que han desarrollado con la Universidad de Florencia la presentarán las próximas semanas en el mundo universitario internacional de la realidad virtual.
La franja de error para contabilizar el número de personas en una aglomeración es entre el 10% y el 20%, la más baja que se conoce hasta ahora
Se trata de un software generado en el área de la vídeo seguridad, monitorización o análisis de comportamiento. Hasta ahora, la problemática científica era evidente: distorsiones de perspectiva, distribución desigual, iluminación compleja, variación de escaleras hacían que los algoritmos de visión artificial no pudieran ser capaces de contar números de jefas dentro de una imagen. Los investigadores del Centro de Visión por Computador han conseguido por fin un algoritmo estable haciendo uso de mapas de densidad, que ayudan a eliminar la mayoría de estas distorsiones.
Enseñar a los ordenadores a contar grandes aglomeraciones necesita imágenes que hayan sido tratadas por un humano. Este es quien le dice al ordenador que hay dentro de cada píxel (como un maestro cuando enseña a un niño una materia que nunca ha cursado). Van de Weijer y su equipo eliminan esta variable, haciendo el proceso mucho más rápido y económico enseñante a los ordenadores a comparar imágenes.
El proceso es relativamente sencillo, pero complejo en la práctica: se le da al ordenador una primera imagen, y después se le dan recortes de esta. Entonces, el ordenador tiene que aprender que hay menos gente en la segunda fotografía (el recorte) que en la primera (el original). Esta técnica, afinada, es la base del aprendizaje de este nuevo algoritmo.
Lladós ha explicado que se trata de una nueva herramienta que puede contabilizar personas en una manifestación con mucha exactitud y que quiere ser útil por un futuro, sin poner en entredicho los números de personas que han asistido a grandes manifestaciones que han quedado como referentes con la historia de un país.
Lladós también ha destacado que al trabajar con imágenes, la tecnología de este lector virtual también puede ser útil en la medicina, para contar por ejemplo número de espermatozoides, o para hacer un inventario del almacén de una empresa.