Vos données ont été « anonymisées »? Ces identifiées peuvent toujours vous identifier

0
27 001

Les informaticiens ont mis au point un algorithme qui permet de sélectionner presque tous les Américains dans des bases de données supposées privées d’informations personnelles.

Vos dossiers médicaux pourraient être utilisés pour des recherches scientifiques. Mais ne vous inquiétez pas, on vous dit que les données d’identification personnelle ont été supprimées .

Les informations vous concernant recueillies par le Bureau du recensement pourraient être rendues publiques. Mais ne vous inquiétez pas, il a également été «anonymisé».

Mardi, les scientifiques ont montré que toutes ces informations pouvaient ne pas être aussi anonymes que promis. Les enquêteurs ont mis au point une méthode permettant de réidentifier les personnes à partir de données censées être anonymes.

Dans la plupart des pays du monde, les données anonymes ne sont pas considérées comme des données personnelles. Elles peuvent être partagées et vendues sans violer les lois sur la protection de la vie privée. Les chercheurs sur le marché sont prêts à payer les courtiers pour une vaste gamme de données, allant des préférences de datation aux tendances politiques, en passant par les achats des ménages ou les favoris en continu.

Même les ensembles de données anonymisées incluent souvent des scores de soi-disant attributs – caractéristiques concernant un individu ou un ménage. Les données de consommation anonymisées vendues par Experian, l’agence de crédit, à Alteryx, une entreprise de marketing, comprenaient 120 millions d’Américains et 248 attributs par ménage .

Des scientifiques de l’Imperial College de Londres et de l’Université catholique de Louvain, en Belgique, ont indiqué dans la revue Nature Communications qu’ils avaient mis au point un algorithme informatique permettant d’identifier 99,98% des Américains dans presque tous les ensembles de données disponibles avec aussi peu que 15 attributs , tels que le genre. , Code postal ou état civil.

Encore plus surprenant, les scientifiques ont mis leur code logiciel en ligne à la disposition de tous. Cette décision a été difficile, a déclaré Yves-Alexandre de Montjoye, informaticien à l’Imperial College London et auteur principal du nouveau document.

Habituellement, lorsque des scientifiques découvrent une faille de sécurité, ils alertent le fournisseur ou l’agence gouvernementale qui héberge les données. Mais il y a des montagnes de données anonymisées circulant dans le monde, toutes en danger, a déclaré le Dr de Montjoye.

Le choix était donc de garder la mère, dit-il, ou de publier la méthode afin que les fournisseurs de données puissent sécuriser les futurs ensembles de données et empêcher que les personnes soient réidentifiées.

« C’est très difficile », a déclaré le Dr de Montjoye. « Vous devez vous croiser les doigts pour le faire correctement, car une fois que c’est sorti, vous ne le retrouverez jamais. »

Certains experts ont accepté la tactique. «C’est toujours un dilemme», a déclaré Yaniv Erlich, responsable scientifique en chef chez MyHeritage, un service de généalogie des consommateurs, et chercheur de renom dans le domaine de la confidentialité des données.

“Faut-il publier ou pas? Le consensus à ce jour est de divulguer. Voici comment vous avancez dans le champ: publiez le code, publiez le résultat. ”

Ce n’est pas la première fois que des données anonymisées se révèlent finalement moins anonymes. En 2016, des individus ont été identifiés à partir de l’historique de navigation sur le Web de trois millions d’Allemands, des données achetées à un fournisseur. Les généticiens ont montré que des individus peuvent être identifiés dans des bases de données d’ADN supposées anonymes .

Les moyens habituels de protection de la vie privée incluent la «désidentification» d’individus en supprimant des attributs ou en leur substituant de fausses valeurs, ou en ne publiant que des fractions d’un ensemble de données anonymisées .

Mais les preuves rassemblées montrent que toutes les méthodes sont inadéquates, a déclaré le Dr de Montjoye. «Nous devons aller au-delà de la désidentification», a-t-il déclaré. « L’anonymat n’est pas une propriété d’un ensemble de données, mais une propriété de la façon dont vous l’utilisez. »

L’équilibre est délicat: les informations qui deviennent complètement anonymes deviennent également moins utiles, en particulier pour les scientifiques qui tentent de reproduire les résultats d’autres études. Mais chaque petit bit qui est retenu dans une base de données rend l’identification des individus plus possible.

«Très rapidement, avec quelques informations, chaque personne est unique», a déclaré le Dr Erlich.

Une solution possible consiste à contrôler l’accès . Ceux qui veulent utiliser des données sensibles – dossiers médicaux, par exemple – devront y accéder dans une pièce sécurisée. Les données peuvent être utilisées mais pas copiées et tout ce qui est fait avec les informations doit être enregistré.

Les chercheurs peuvent également accéder aux informations à distance, mais «il existe des exigences très strictes pour la salle où le point d’accès est installé», a déclaré Kamel Gadouche, directeur général d’un centre de données de recherche en France, CASD, qui s’appuie sur ces méthodes.

Le centre contient des informations sur 66 millions de personnes, y compris des données fiscales et médicales, fournies par les gouvernements et les universités. « Nous ne limitons pas l’accès », a déclaré M. Gadouche. « Nous contrôlons l’accès. »

Mais il y a un inconvénient à l’accès restreint. Si un scientifique soumet un article de recherche à une revue, par exemple, d’autres voudront peut-être confirmer les résultats en utilisant les données – un défi si les données ne sont pas librement disponibles.

D’autres idées incluent quelque chose appelé «calcul multipartite sécurisé».

«C’est un truc cryptographique», a déclaré le Dr Erlich. «Supposons que vous vouliez calculer le salaire moyen pour nous deux ou pour nous deux. Je ne veux pas vous dire mon salaire et vous ne voulez pas me dire le vôtre.

Ainsi, a-t-il dit, des informations cryptées sont échangées et déchiffrées par un ordinateur.

«En théorie, cela fonctionne très bien», a déclaré le Dr Erlich. Mais pour la recherche scientifique, la méthode a des limites. Si le résultat final semble faux, «vous ne pouvez pas le déboguer, car tout est tellement sécurisé que vous ne pouvez pas voir les données brutes».

Les archives rassemblées sur nous tous ne seront jamais complètement privées, a-t-il ajouté: « Vous ne pouvez pas réduire le risque à zéro ».

Oran | Achraf Kahia.

Une version de cet article a été imprimée aujourd’hui dans l’édition Djazairy Newspapers. Commande de réimpressions | PDF | Souscrire

Les opinions exprimées dans les commentaires sont celles des propriétaires et non celles de Djazairy Newspapers. Les propos qui incluent des abus envers des personnes, d’un peuple ou d’un État seront annulés. Il est rappelé aux visiteurs qu’il s’agit d’un site d’information généraliste et économique et n’accepte pas les racontars politiques, idéologiques ou religieux.


Genesis 2020 | Sponsorisé

Droits de douane sur la Chine à mi-décembre

Le président américain Donald Trump a tiré plusieurs balles à la fois, dans le cadre de sa guerre commerciale, non ...
Lire la suite…

Dans la lutte pour la domination industrielle, la Chine va gagner !

Certains décideurs politiques et décideurs s'opposent à la première phase de l'accord commercial, rédigé par Donald Trump, car il se ...
Lire la suite…

Avec ses pertes continues, est-il temps de changer de stratégie pour Uber ?

Uber avait été intelligent - ou probablement chanceux - d’être inscrit au marché boursier avant WeWork, qui avait frappé l’ambiance ...
Lire la suite…

Comment les entreprises trompent-elles les consommateurs?

Pour augmenter leurs profits, les entreprises recourent à divers moyens légitimes, tels que la décision d’améliorer leurs produits, cherchent à ...
Lire la suite…

Repensez-y, la production conduit toujours vers la croissance

Beaucoup associent l'augmentation de la production à la croissance et à la prospérité économique. Bien que cette prémisse ait un ...
Lire la suite…

Vengeance d’Adam Smith

Ou, comment Trump pousse-t-il à bout le plus long cycle de croissance de l'histoire des États-Unis d'Amérique ? En juillet, ...
Lire la suite…

Madame Soleil, l’horoscope au Club Dorothée

Non, ce n'est pas une blagues sur les blondes ou sur la canitie. D'après les données du FMI, l'économie mondiale ...
Lire la suite…

William Deming et le sursaut Japonais

En 1980, la chaîne de télévision américaine NBC a envoyé une de ses équipes au Japon dans le but de ...
Lire la suite…

Kelatma | Sponsorisé

Trophée du tourisme pour encourager les initiatives et appuyer l’innovation

Abdelkader Benmessaoud a qualifié, mardi à Alger, d'"importante" l'organisation de la première édition du Trophée du tourisme pour l'encouragement des ...
Lire la suite…

2020 devra être l’année d’un véritable essor du secteur du tourisme en Algérie

Abdelkader Benmessaoud, ministre du Tourisme et de l’Artisanat, a affirmé à Oran que 2020 devra être l’année d'un véritable essor ...
Lire la suite…

La prochaine révolution dans le monde du tourisme

Les entreprises de voyages et d’aviation utilisent souvent des technologies modernes pour faciliter leurs tâches, comme un système de tarification ...
Lire la suite…

Adrar va vulgariser les potentialités touristiques pour la réussite de la saison

Le secteur du tourisme et de l’artisanat dans la wilaya d’Adrar s’emploie à promouvoir les opportunités de vulgarisation des diverses ...
Lire la suite…

Tourisme saharien, nécessité de diversifier les activités et d’ouvrir de nouvelles voies dans les régions sud

Le ministre du Tourisme et de l'artisanat, Abdelkader Benmessaoud, a affirmé à Alger la nécessité de diversifier les activités touristiques ...
Lire la suite…

Vers la création de pôles d’excellence de tourisme en Algérie

Le ministre du Tourisme et de l'Artisanat, Abdelkader Benmessaoud, a fait état mardi à Chlef de préparatifs pour la création ...
Lire la suite…

Parc hôtelier, 12.000 nouveaux lits en 2019

Le parc hôtelier a été renforcé au niveau national de "12.000 nouveaux lits" au cours de l’année 2019, a affirmé ...
Lire la suite…