Los datos de navegación anonimizados son un mito: nos identifican de modo similar a los datos biométricos, según Mozilla

El historial de navegación web de un usuario consiste en la lista de sitios web que este ha visitado. Un usuario podría pensar que, si no aparecen temáticas ‘sensibles’ en el mismo, es una información bastante inofensiva.



Pero no es así, ni mucho menos. Según el experto en privacidad Lukasz Olejnik,

«[Los historiales] transmiten abundante información sobre el usuario, hasta el punto de poder extraer información psicométrica o demográfica.

De algún modo, el historial de navegación se parece, por su singularidad y estabilidad, a los datos biométricos».

Estamos acostumbrados a oír a los representantes de las empresas tecnológicas que los datos que recopilan en Internet no pueden ser utilizados para identificar a los usuarios porque pasan por procesos de ‘anonimización’, en muchos casos basados en la agregación de dichos datos.

Sin embargo. Olejnik (como muchos otros expertos en privacidad) lleva años advirtiendo contra la fiabilidad de dicha anonimización: en 2012 fue co-autor de un famoso ‘paper’ llamado «Por qué Johny no puede navegar en paz: sobre lo singular de los patrones de navegación web» (PDF), que demostraba que los perfiles de navegación de cada usuario no sólo son muy distintos entre sí, sino que también son particularmente estables.

«Los historiales de navegación web son datos personales. Afróntalo», sentencia Olejnik.

9 años sin cambios en materia de privacidad web

Ahora, tres ingenieros de Mozilla han querido reproducir y ampliar aquella investigación, ocho años más tarde, con un nuevo paper títulado «Por qué seguimos sin poder navegar en paz: sobre la singularidad y la identificabilidad de los historiales de navegación web«.

¿Resultado? De 52.000 perfiles de navegación de usuarios de Firefox, los investigadores pudieron identificar 48.919, una cifra que apenas se reducía incluso cuando sólo se tenían en cuenta los 100 sitios web más relevantes de cada historial.

Olejnik, que ha publicado un análisis del trabajo de sus ‘sucesores’, afirma que se trata de una evaluación «más rigurosa» del problema que abordó en 2012, pero que, aún así, «los resultados se mantienen»:

«La tasa de exclusividad del historial de navegación web, calculada utilizando métodos similares al de nuestro estudio, resultó ser del 99%. [La investigación] indica también que los usuarios pueden ser reidentificados mediante técnicas de fingerprinting en el 80% de los casos. Tales cifras resultan sorprendentemente altas».

En resumen, que por muy anónimos que sean los datos, mientras nuestros patrones de navegación no cambien bruscamente un pequeño porcentaje de nuestros historiales web conceden a las compañías todas las facilidades para identificarnos (y, por tanto, rastrearnos).

Aunque, claro, algunas compañías tienen más facilidades que otras para eso, por su papel predominante en el ecosistema digital:

Reidentfhist2

Vía | Lukasz Olejnik & FOSSbytes

Fuente: Link