Videnskab
 Science >> Videnskab >  >> Andet

Undersøgelse af ny metode brugt til at bevare privatlivets fred med amerikanske folketællingsdata tyder på, at nøjagtigheden har lidt

Estimeret root mean square error (RMSE) for befolkningstal for en race/etnicitetsgruppe på hvert geografisk niveau. RMSE kvantificerer den gennemsnitlige fejlstørrelse for en given geografi for en bestemt geografisk enhed. Trekanter for RMSE indikerer, at den estimerede gennemsnitlige kvadratfejl var negativ og derfor blev sat til nul. Kredit:Science Advances (2024). DOI:10.1126/sciadv.adl2524

Et lille team af politologer, statistikere og dataforskere fra Harvard University, New York University og Yale University har fundet ud af, at det amerikanske folketællingsministerium ved at skifte til en ny metode til bedre beskyttelse af privatlivets fred har introduceret faktorer, der reducerer nøjagtigheden i nogle tilfælde .



I deres papir offentliggjort i tidsskriftet Science Advances , beskriver gruppen, hvordan de analyserede en fil leveret af folketællingsembedsmænd for at måle nøjagtigheden i offentligt tilgængelige folketællingsdata og deres resultater.

Forud for den amerikanske folketælling i 2020 valgte embedsmænd fra U.S. Census Bureau, der var bekymrede over privatlivets fred for de personer, der giver svar på folketællingen, at ændre den metode, hvorpå de sikrede datasikkerhed.

Den gamle metode blev kaldt "bytte". Det indebar at bytte data fra folk, der bor i en blok af en by, med folk i en anden blok, og derved forhindrede folk i at blive identificeret baseret på deres data. Den nye metode kaldes "differential privacy", og den indebærer at tilføje, hvad Bureauet beskriver som "støj" til hvert stykke data, der indsamles.

I denne nye indsats kunne forskerholdet ikke finde noget eksempel på, at en ekstern enhed udførte forskning for at afgøre, om den nye metode faktisk gav mere privatliv, eller om de behandlede data var mere eller mindre nøjagtige, end det havde været tilfældet, da swapping blev brugt. Så de begyndte en af ​​deres egne.

Undersøgelsen begyndte med, at forskerholdet bad Census Bureau om at give dem adgang til det, der kaldes den støjende målefil (NMF) - den, der blev brugt til 2020-tællingen. Præsidiet afviste anmodningen, hvilket fik holdet til at sagsøge dem. Til sidst blev retssagen droppet, da bureauet indvilligede i at give holdet NMF i forbindelse med den meget mindre folketælling i 2010 - en, der blev udført som en måde at teste den nye metode på og involverede både bytte og differentiering.

Forskerne analyserede derefter denne fil som en måde at studere indvirkningen på nøjagtigheden af ​​at skifte til det nye system. Derved fandt de ud af, at de to systemer samlet set leverede nogenlunde samme nøjagtighed i bred skala. Men de fandt også tegn på en reduktion i nøjagtighed på blokniveau af en type, der kunne have en negativ indvirkning på minoriteter og multiraciale befolkninger.

Flere oplysninger: Christopher T. Kenny et al., Evaluering af skævhed og støj forårsaget af U.S. Census Bureaus metoder til beskyttelse af privatlivets fred, Science Advances (2024). DOI:10.1126/sciadv.adl2524

Journaloplysninger: Videnskabelige fremskridt

© 2024 Science X Network




Varme artikler