Confidentialité différentielle : Google veut marier vie privée et big data

06 septembre 201906/09/2019 • 11:45

Cette expression ne vous dit peut-être rien, mais la « confidentialité différentielle » pourrait représenter l’avenir de la vie privée en ligne. Google vient de rendre cette jeune technique plus simple d’accès aux développeurs en publiant une librairie open source en la matière.

La conférence Google I/O 2019 en mai dernier.

« Confidentialité différentielle », voilà un terme dont le commun des mortels n’a probablement jamais entendu parler. À moins peut-être d’être un fan d’Apple, vu que la firme à la pomme promeut le concept dans ses appareils depuis 2016. C’est pourtant une avancée majeure en science des données, qui permettrait entre autres d’analyser des informations sur des utilisateurs sans porter atteinte à leur vie privée individuelle.

Et Google compte bien populariser cette technique. L’entreprise vient de publier une librairie logicielle open source de confidentialité différentielle, avec pour but de rendre celle-ci accessible à des programmeurs qui ne sont pas forcément des chercheurs en informatique. Les développeurs peuvent maintenant directement piocher dans ces bouts de code pour leurs projets. « En plus d’être librement accessible, nous avons voulu qu’elle soit facile à déployer et utile ».

À sa dernière conférence Google I/O en 2019, le géant de Mountain View avait d’ailleurs mentionné l’ajout de la confidentialité différentielle dans certains de ses produits, sans rentrer dans beaucoup de détails.

Qu’est-ce que la confidentialité différentielle ?

La confidentialité différentielle (differential privacy, ou « DP ») est un concept informatique mis au point en 2006 par la chercheuse Cynthia Dwork de Microsoft. L’idée est de faire en sorte que peu importe que vos informations personnelles soient récoltées ou non, cela n’aura pas d’incidence sur ce qu’on pourra apprendre sur vous grâce aux données analysées sur d’autres personnes. Dit ainsi, cela peut paraître assez abstrait, mais l’informaticienne donne un exemple bien plus facile à comprendre.

Soit un groupe de personnes où on trouve à la fois des délinquants et des innocents. On veut connaître la proportion de délinquants, mais ceux-ci ne se dénonceront jamais si cette information (hautement sensible !) peut leur être associée personnellement. La solution est de demander à chaque personne de jouer à pile ou face en cachette. Si c’est face, elle doit dire la vérité. Si c’est pile, elle doit relancer la pièce pour choisir au hasard de dire « je suis délinquant » ou « je suis innocent ».

Les délinquants n’auront donc plus peur d’avouer, vu qu’ils savent que beaucoup d’innocents diront aussi « je suis délinquant ». Quelques calculs statistiques permettent alors de retrouver la vraie proportion de délinquants dans le groupe ; mais on ne sait pas individuellement qui en est un ou pas. La DP se base sur des variantes plus sophistiquées de cette procédure. Avec la promesse, peut-être, de réconcilier big data et vie privée sur Internet.

https://www.numerama.com/tech/264953-confidentialite-differentielle-resolvez-5-enigmes-pour-comprendre-ce-concept-cher-a-apple.html

Rejoignez-nous de 17 à 19h, un mercredi sur deux, pour l’émission UNLOCK produite par Frandroid et Numerama ! Actus tech, interviews, astuces et analyses… On se retrouve en direct sur Twitch ou en rediffusion sur YouTube !

Signaler une erreur dans le texte

Source : Google Developers

Les notifications web

Les notifications push vous permettent de recevoir toute l'actualité de Frandroid en temps réel dans votre navigateur ou sur votre téléphone Android.

Activer les notifications

Choisir les notifications

En savoir plus sur les notifications web

JujuMarquez

Aucun rapport, oui je vais sur youtube mais je sais bien qu'il étudient tout. C'est pas parce qu'on y va qu'on y a confiance... L'expert du cirque parle écoutez le ^^
M_a_t_y_o_t

Il faudrait limiter le nombre de lancer donc comme tu dis. Une faille serait de collecter tes résultats de lancer à travers plusieurs application par exemple et les croiser. Et puis generalisons le problème, par exemple à la localisation. Est ce qu'une personne est chez sa maîtresse ? a chaque demande on générera un résultat aléatoire ou on renseignera sa vraie localisation . Et comme on doit rafraîchir la localisation, on ne peut pas se limiter à 2 lancers. Et donc on collecte un ensemble de localisations ou il est souvent chez sa maîtresse.
expert

tu va sur youtub ? donc t'a confiance sortez les clowns, c'est la minute des trapezistes😜
maxime edouard

Tu n'as évidemment pas compris le principe. Tu fais maximum 2 lancés, minimum 1 Si tu as fait un seul lancé alors la réponse que tu as donnée est vraie Si tu as fait 2 lancés alors la réponse que tu as donnée est aléatoire. On ne regarde pas combien de lancé tu as fait donc on ne peut pas savoir si ta réponse est vraie ou fausse donc tu n'as aucun intérêt à mentir, par contre dans le groupe (s'il y a assez de personnes) on peut connaître la proportion de délinquants.
expert

si google alors menteur or espion then afficher 'fuke' endif variables menteur ; "securité";"vie privée";"mise a jour"; espion ; "aspirateur";"revente";"IA";"pour votre bien"; "etc .." fuke; "loop sans fin";"pigeon";"bien sur du c*** censuré rem purger client by lobotomie, fonction reccurcive sans fin de boucle 🍆
Fatnums

Salut, ce n'est pas tout à fait de la "récolte de données anonymisées", c'est bien plus compliqué. Pour savoir si t'es un délinquant, le système se base sur un algo pour en sortir des stats...alors que dans le cas d'une donnée anonymisée, aucun algo n'est nécessaire pour savoir que tu es un délinquant....c'est légèrement différent....Après savoir si ça sera correctement mis en place et utilisé de façon éthique, c'est une autre histoire ;)
Reggie1000

Surtout venant de Google
emmanuel milcent

Peut être parce que tu as des choses ) te reprocher et que tu veux cacher, petit canaillou :)
moltes

Ce concept est déjà censé être en place, la fameuse "récolte de données anonyme" Donc rien de nouveau (à part que Google veut simplifier et généraliser la pratique pour récolter encore plus de données...)
moltes

Mais non c'est des gentils (-:
Verisign

Non, merci
M_a_t_y_o_t

si on te demande de jouer à pile ou face 10 fois, on finira par savoir qui est délinquent même en ne collectant la donnée qu'a partir de cette api. Et ce avec une certitude de 99.9%
expert

aucune confiance
JujuMarquez

Mouais mélanger vie privée et collecte de données, jsais pas pourquoi j'ai pas confiance ^^