Debat om nye foranstaltninger til beskyttelse af personlige oplysninger i folketællingen overser større problemer med datafejl i titel I-finansiering

Kredit:Pixabay/CC0 Public Domain

Kontrovers omgiver U.S. Census Bureaus nye foranstaltninger til at bevare privatlivets fred, men en ny undersøgelse undersøger, hvordan eksisterende datafejl kan udgøre et endnu større problem for evidensbaserede politikker. Hjørnestenen i Census Bureaus opdaterede privatlivsforanstaltninger, differentieret privatliv, kræver injicering af statistisk usikkerhed eller støj ved deling af følsomme data. Forskere, politikere og aktivister har rejst bekymringer om effekten af denne støj på afgørende brug af folketællingsdata. Alligevel overser de fleste analyser af afvejninger omkring differentieret privatliv dybere usikkerheder i folketællingsdata. I en ny undersøgelse undersøgte forskere, hvordan uddannelsespolitikker, der bruger folketællingsdata, misallokerer midler som følge af statistisk usikkerhed.

Undersøgelsen fandt ud af, at fejlallokeringer på grund af støj tilført privatlivets fred kan være små eller ubetydelige sammenlignet med fejlallokeringer på grund af eksisterende kilder til datafejl såsom fejlrapportering eller manglende respons. Men undersøgelsen finder også, at enkle politiske reformer kan hjælpe finansieringsformler med at adressere ulige fordeling af usikkerhed fra datafejl og glatte vejen for ny beskyttelse af privatlivets fred, hvilket tilbyder en mulighed for kompromis mellem målrettet politik, retfærdighed og bedre beskyttelse af privatlivets fred.

Studiet, udført af forskere ved Carnegie Mellon University (CMU) og offentliggjort i Science , fokuserer på afsnit I i loven om elementær og sekundær uddannelse, som giver økonomisk bistand til skoledistrikter med et stort antal børn fra lavindkomstfamilier for at hjælpe med at sikre, at alle børn opfylder statens uddannelsesstandarder. Føderale midler tildeles gennem formler, der primært er baseret på folketællingsestimater af fattigdom og udgifterne til uddannelse i hver stat. I 2021 bevilgede den amerikanske regering mere end 16,5 milliarder dollars i titel I-midler til mere end 13.000 skoledistrikter og andre lokale uddannelsesbureauer.

I denne undersøgelse brugte forskerne en nøjagtig simulering af titel I-tildelingsprocessen til at sammenligne de politiske virkninger af støj tilført for privatlivets fred med virkningerne af eksisterende statistisk usikkerhed. Specifikt sammenlignede de virkningerne af kvantificerede datafejl og af en mulig differentielt privat støjinjektionsmekanisme. For eksempel, af de $11,7 milliarder i 2021 Titel I-midler, som denne undersøgelse undersøgte, blev $1,06 milliarder tildelt væk fra nogle distrikter i en gennemsnitlig kørsel af simuleringen alene på grund af datafejl. Dette tal steg med kun 50 millioner dollars, da forskerne injicerede støj for at give en relativt stærk beskyttelse af privatlivets fred.

"Vi var særligt opmærksomme på den måde, hvorpå Titel I implicit koncentrerer de negative virkninger af statistisk usikkerhed på marginaliserede grupper," forklarer Ryan Steed, en Ph.D. studerende på CMU's Heinz College, som ledede undersøgelsen. "En svækkelse af privatlivets fred hjælper ikke meget for disse grupper, og for dem kan det være særligt risikabelt at deltage i en Census-undersøgelse."

Resultaterne viser, at fejlallokeringer på grund af statistisk usikkerhed især er til ulempe for marginaliserede grupper (f.eks. sorte og asiatiske studerende; distrikter med store populationer af spansktalende studerende). Hvorvidt en demografisk gruppe mistede finansiering afhang af, om dens medlemmer havde tendens til at bo i høj- eller lavfattigdomsdistrikter, inklusive dem i tættere, normalt byområder.

"Men vi identificerede også politiske reformer, der kunne reducere de forskellige virkninger af både datafejl og privatlivsmekanismer," bemærker Steven Wu, assisterende professor ved CMU's School of Computer Science. "For eksempel reducerede brugen af flerårige gennemsnit snarere end estimater fra et enkelt år både den samlede fejlallokering og forskelle i resultater."

Blandt undersøgelsens begrænsninger påpeger forfatterne, at deres undersøgelse ikke tager højde for systematiske undertællinger og mange andre ikke-kvantificerede former for statistisk usikkerhed, der påvirker fattigdomsestimater, herunder tidligere foranstaltninger til beskyttelse af privatlivets fred, såsom udveksling af data.

"Vores resultater tyder på, at virkningerne af differentieret privatliv i forhold til andre fejlkilder i folketællingsdata kan være minimal," bemærker Alessandro Acquisti, professor i informationsteknologi og offentlig politik ved CMU's Heinz College, som var medforfatter til undersøgelsen. "Simpelthen anerkendelse af virkningerne af datafejl kan forbedre fremtidig politikdesign for både finansieringsformler og undgå afsløring." + Udforsk yderligere

Differentieret privatliv er det rigtige valg for 2020 US Census

Sidste artikelAt erstatte fossile brændstoffer med vedvarende energi inden 2050 er umuligt uden at reducere energiforbruget

Næste artikelEffektiv AI-teknologi til MR-dataanalyse