Kredit:CC0 Public Domain
Efter U.S. Census Bureau meddelte, at det ændrede, hvordan det beskytter enkeltpersoners identiteter til 2020 Census, et Penn State-ledet forskerhold begyndte at evaluere, hvordan disse ændringer kan påvirke folketællingens dataintegritet.
Census Bureau foreslår at bruge differentieret privatliv, en ny metode, der forsøger at beskytte enkeltpersoners identiteter, når de offentliggør offentlige data. Folketællingsdata bruges til at fordele føderal finansiering, der påvirker lokalsamfund og også bestemmer kongresrepræsentationen.
Alexis Santos, assisterende professor i menneskelig udvikling og familiestudier ved Penn State, sammen med forskerne Jeffrey Howard, assisterende professor ved University of Texas i San Antonio, og Ashton Verdery, adjunkt i sociologi, demografi, og social dataanalyse hos Penn State, undersøgte dødeligheden i 2010. Forskerne sammenlignede begge metoder til beskyttelse af privatlivets fred og implikationen af denne ændring for bedre at forstå sundhedsforskelle i USA. Værket blev udgivet for nylig i Proceedings of the National Academy of Sciences .
Forskerholdet opdagede, at når differentiel privatlivsmetode blev brugt på folketællingsdata, det frembragte dramatiske ændringer i befolkningstal for racemæssige og etniske minoriteter sammenlignet med de traditionelle metoder.
"Vi fokuserede på dødelighedsestimater, fordi de er en vigtig målestok på befolkningsniveau, for hvilken data indsamles og formidles på nationalt plan, og fordi dødeligheden er en kritisk indikator for befolkningens sundhed, " sagde Santos.
Forskerholdet undersøgte derefter ændringerne i dødeligheden som følge af de to systemer til undgåelse af afsløring ved storbyklassifikationer.
"Vi opdagede, at ved at bruge differentieret privatliv, der var både tilfælde af under- og overoptælling af befolkningen. I landdistrikterne, der var underoptælling af racemæssige og etniske minoriteter, mens der i byområder var en overtælling af disse befolkninger, " sagde Santos.
Forskerne fandt ud af, at nogle uoverensstemmelser mellem de to metoder til dataanalyse oversteg en forskel på 10 %.
"Dette er meget bekymrende, fordi det kan påvirke, hvor meget finansiering programmer modtager for et specifikt geografisk område, " sagde Santos. "Disse uoverensstemmelser kan resultere i undervurderede sundhedsrisici i nogle områder, og samtidig overdrive i andre, hvor der ikke er et stort behov."
Ifølge Santos, resultaterne fremhæver konsekvenserne af at implementere differentieret privatliv og demonstrerer udfordringerne ved at bruge de dataprodukter, der stammer fra denne metode.
"Census Bureau har været meget modtagelig over for vores forskning, og udviste bekymring for nøjagtigheden af dataene, " sagde Santos. "Vi planlægger at gå videre med yderligere forskning for at bestemme, hvordan differentieret privatliv kan påvirke befolkningsvækst estimater og befolkningsændringer fra folketællingsår til folketællingsår. Vi har stadig tid til at finjustere den differentielle privatlivsalgoritme, og vores forskning vil hjælpe med at udpege forbedringsområder."