Kredit:CC0 Public Domain
Nye privatlivslove som Europas generelle databeskyttelsesforordning (GDPR) og California Consumer Privacy Act (CCPA) har affødt en ny industri af virksomheder og platforme, der annoncerer for, at de kan anonymisere dine data og overholde loven.
Men MIT-forsker Aloni Cohen siger, at han er i tvivl om disse påstande, og hans teams seneste arbejde viser, at der er grund til at være skeptisk.
Specifikt, en ny tidsskriftsartikel fra Cohen og professor Kobbi Nissim hævder, at en anonymitetsteknik kaldet k-anonymitet – som bruges af mange virksomheder, der fremsætter sådanne påstande – ikke forhindrer en bruger i at blive udpeget og afanonymiseret ved at se på platformens bredere data. Forskerne studerer en ny type angreb, de kalder "prædikatudskillelse, " modelleret efter en type GDPR-privatlivskrænkelse, der kaldes at udskille.
"Jeg synes, det er rimeligt at sige, at mange af påstandene fra disse "anonymitet-som-en-tjeneste"-virksomheder er mistænkelige, siger Cohen, hvis artikel med Nissim blev offentliggjort online i dag i PNAS . "Dette papir er et skridt i at teste det og vise hullerne i deres tilgang."
Holdet hævdede, at virksomheder, der bruger k-anonymitet til at anonymisere data, i stedet kan anvende differentieret privatliv, en nyere teknik, der involverer præcist kontrolleret randomisering for at maskere tilstedeværelsen eller fraværet af et bestemt individ i et datasæt. Forskerne viser, at differentieret privatliv forhindrer prædikater i at udskille angreb.
Differentieret privatliv er ved at blive taget i brug i omgivelser, hvor mere traditionelle tilgange til anonymisering anses for utilstrækkelige. US Census Bureau bruger differentieret privatliv til at give fortrolighed til 2020-folketællingen. Vedtagelsen af GDPR ansporede også Facebook til at bruge differentieret privatliv til at hjælpe samfundsforskere, der studerer desinformation online.
"Selvom vi viser differentieret privatliv forhindrer prædikat at udskille angreb, det er ikke nødvendigvis fuldgyldig anonymisering i henhold til loven, " siger Cohen. "På den anden side viser dette arbejde, at som hovedregel, du bør være skeptisk over for enhver virksomhed, der fortæller dig, at deres brug af k-anonymitet giver dig "GDPR compliance".
Papiret repræsenterer også et spændende nyt eksempel på, hvordan matematik og computerkode kan bruges til kvantificerbart at bestemme, om virksomheder rent faktisk følger loven.
"Vi føler, at det at bevise, at noget er PSO-sikkert, ikke kun er et matematisk koncept, men en, der kan bruges til at understøtte en juridisk konklusion, og det burde faktisk have juridiske konsekvenser, siger Cohen.