Collecte de données, pourquoi il ne faut plus dire “ je n’ai rien à cacher”

Nous savons qu’à chacun de nos passages sur internet nous laissons des traces numériques qui sont enregistrées et traitées par les entreprises. Beaucoup pensent que cette collecte ne sert qu’à nous envoyer des publicités ciblées, ce qui fait souvent dire « je m’en fiche car je n’ai rien à cacher ». Or ce n’est pas si simple …

Le péché originel

Après la bulle technologique des années 2000, l’internet promettait d’être le nouveau moteur de croissance. Mais les utilisateurs n’étaient pas prêts à payer pour consommer les services des entreprises en ligne. Ces dernières ont alors décidé de proposer des services gratuits et d’utiliser les données collectées sur leurs utilisateurs à des fins publicitaires. C’est ce qu’Ethan Zuckerman, blogueur et activiste sur internet appelle « le péché originel de l’internet » (The Atlantic, The Internet’s original sin, 14/08/2014). Pour lui, ce système économique basé sur la diffusion de publicité en ligne afin de collecter des informations sur les utilisateurs était une erreur qui mène aujourd’hui à une spéculation effrénée basée sur les données personnelles, et à des usages dévoyés. C’est ce que nous avons découvert avec l’affaire médiatique de Cambridge Analytics l’année dernière.

La face cachée des données

Pour tenter d’encadrer les dérives, la réglementation européenne sur la protection de données (RGPD) entrée en vigueur en mai dernier est un très bon début. Mais, d’une part, nous ne savons pas forcément à quoi nous consentons lorsque, sur un site web, nous acceptons l’utilisation de cookies ; et, d’autre part, ce que nous choisissons de partager sur internet n’est que la face cachée des informations collectées. C’est ce qu’explique Katarzyna Szymielewicz, co-fondatrice de l’association Panoptykon (association polonaise de défense des libertés individuelles et des droits de l’homme contre le développement des technologies de surveillance) dans l’article Your digital identity has three layers, and you can only protect one of them (Quartz, 25/01/2019).

Ceux qui collectent nos données possèdent trois niveaux d’information sur nous. Le premier, qui est sous notre contrôle, recense les informations que nous postons sur les réseaux sociaux et applications mobiles (information de profil, posts, messages privés, inscription à des évènements, sites web visités, etc.). Le deuxième analyse nos comportements. Il est composé de metadonnées, c’est à dire des informations qui fournissent, sans que nous en soyons conscients, un contexte à nos profils. Il s’agit, via des informations de géolocalisation, de cartographie de nos relations intimes et sociales, et de nos comportements (récurrence et durée des lieux visités, des contenus consultés, de la nature des achats en ligne, et même de la vitesse à laquelle on tape sur le clavier et du mouvement de nos doigts sur les écrans) de construire le canevas de nos habitudes de vie. Le troisième niveau interprète les deux premiers, grâce à des algorithmes qui nous comparent avec d’autres profils, afin de faire des corrélations statistiques. Il ne s’agit plus de savoir ce que nous faisons mais qui nous sommes. Or, « si vous n’êtes pas un individu typique, que vous présentez des caractéristiques inhabituelles, il est possible qu’un algorithme interprète mal votre comportement ».

Discrimination et censure : les dérives

Avec l’émergence de l’intelligence artificielle vient la promesse d’automatiser, sur la base de nos profils créés par les algorithmes, les décisions des banques, des assureurs, des recruteurs, ou encore des administrations publiques. Si notre profil ou celui de notre voisin a été catégorisé de manière injuste ou discriminée par un algorithme, cela pourrait alors avoir des répercussions importantes. Comme se voir injustement refuser un crédit, un entretien de recrutement, ou encore une place de crèche.

Par ailleurs, dans les pays ou la liberté d’expression n’est pas une évidence, ce profilage peut renforcer la censure et la surveillance exercée à l’égard de dissidents politiques, de communautés discriminées, ou encore à d’activistes écologiques. C’est ce qui fait réagir le lanceur d’alerte et ancien employé de la NSA Edward Snowden : « dire que la vie privée ne vous intéresse pas parce que vous n’avez rien à cacher c’est comme dire que la liberté d’expression est inutile parce que vous n’avez rien à dire » (« Nothing to hide » documentaire de Marc Meillassoux et Mihaela Gladovic, 2017). C’est donc pour nous, mais aussi pour les autres, dans un souci de société, que nous devons nous préoccuper de ce qui est fait de nos données.

Infléchir la tendance

Comment ? Tout d’abord en s’intéressant davantage au fonctionnement des technologies. Car mieux on les comprend, mieux on peut contrôler ce qu’elles font. Puis, pour Jeremie Zimmermann, co-fondateur de La Quadrature du Net (Association de défense des droits et libertés des citoyens sur Internet) interviewé dans « Nothing to hide », pour changer la donne en matière de confidentialité des données, l’utilisation des logiciels libres d’utilisation et de modification (open source) doit se généraliser ; ainsi que celle de services décentralisés permettant des échanges de données et de valeurs en toute transparence comme ceux permis par la technologie de la blockchain. Enfin, Katarzyna Szymielewicz propose de ne plus laisser la possibilité aux entreprises de deviner qui nous sommes mais de leur fournir directement ces informations. « Il est temps de traiter les utilisateurs comme des individus actifs et non comme des participants passifs. Avec l’entrée en vigueur du RGPD et la multiplication des entreprises misant sur la confiance et la transparence, il devient réaliste de pouvoir mettre en place de nouveaux modèles de fonctionnement ».

Et en attendant, il existe des outils qui permettent de limiter la collecte de nos données. Par exemple les moteurs de recherche « Qwant », « Disconnect search » et « Duckduckgo » n’enregistrent pas les données ; la messagerie « Signal » chiffre tous les messages ; le navigateur « Tor » protège certaines informations identifiables comme les sites web visités et le fournisseur d’accès à internet utilisé ; ou encore le plug in « Ghostery » bloque les trackers utilisés pour observer nos comportements en ligne et les publicités.