Kredit:CC0 Public Domain
Bekymringerne over vælgersvindel er steget i de senere år, især efter at føderale embedsmænd rapporterede, at russiske hackere forsøgte at få adgang til vælgerregistreringer ved præsidentvalget i 2016. Der er rapporteret administrative stemmefejl, også; for eksempel, en revision foretaget af statslige embedsmænd afslørede, at 84, 000 vælgerregistreringer blev utilsigtet duplikeret af California Department of Motor Vehicles (DMV) ved primærvalget i juni 2018.
Michael Alvarez, professor i statskundskab ved Caltech, og hans team hjælper med situationen ved at udvikle nye algoritmer til sporing af vælgerdata. De har samarbejdet med Neal Kelley, Orange Countys vælgerregistrator, og, fra april 2018 til maj 2019, vurderet mere end 1,5 millioner stemmerekorder i Orange County. Projektets første resultater, rapporteret i journalen Amerikansk politisk forskning , vise, at denne type teknologi kan bruges til at vurdere et valgs integritet. I dette tilfælde, imidlertid, der blev ikke fundet tilfælde af svig eller væsentlige administrative fejl.
"Manipulationer til vælgerregistreringer kan skabe kaos på et valg, " siger Alvarez, som også arbejder på det større Caltech/MIT Voting Technology Project, dannet i kølvandet på det kontroversielle præsidentvalg i 2000. "Du kunne få folk til at dukke op for at stemme, som ikke er på listen, eller folks adresser kan ændres i databaserne, så vælgerne ikke får deres instruktioner med posten. Der er mange scenarier, nogle svigagtige og nogle administrative, som kan påvirke kvaliteten og integriteten af valg negativt."
Holdets algoritmer er designet til at tage øjebliksbilleder af stemmeregistreringer på daglig basis. Selv uden svindel eller fejl, stemmeregistrene ændrer sig konstant på grund af tilføjelse og fjernelse af vælgere, ændringer i adresser og andre administrative processer. Alvarez og hans team, ledet af Caltech kandidatstuderende Seo-unge Silvia Kim, udviklet en algoritme til at måle de dynamiske ændringer, der finder sted i stemmeregistreringer, og en anden algoritme til at lede efter statistiske anomalier i den dynamiske proces.
"Vi vil sikre os, at de ændringer, vi ser, er forventede og ikke uønskede, siger Kim, en samfundsvidenskabelig ph.d.-kandidat med fokus på statskundskab, som lærte computerprogrammering på egen hånd, mens hun arbejdede på dette projekt. "Er der nogle tydelige røde flag?"
"Orange County er et fantastisk laboratorium for denne undersøgelse, " siger Alvarez. "Neal Kelley er meget dedikeret til denne proces, og vi har opbygget et stærkt samarbejde med Orange County."
En tredje algoritme udviklet af teamet scanner for dubletter af stemmeregistreringer. Dubletter er en normal forekomst i vælgerdatabaser, der opstår, for eksempel, når vælgere flytter eller registrerer sig flere steder, men de kan også indikere misbrug eller fejl.
"Overvågning for dubletter er en indikator for tilstanden af en vælgerdatabase, " siger Spencer Schneider, en Caltech sophomore, der arbejdede på projektet som en Summer Undergraduate Research Fellow (SURF) studerende, og som er den anden forfatter af papiret.
Holdet siger, at et mål med projektet er at dele, hvad de lærer, med offentligheden, så andre kan overvåge stemmeregistreringer, og politologer kan få adgang til dataene til deres forskning. Til det formål, holdet har lagt deres resultater og computerkoder online. De har også startet et lignende projekt med Los Angeles County; i Oregon, de overvåger stemmer, der kommer ind med posten.
"Administrative fejl og potentialet for skældsord er stort ved valget i USA, og vi er nødt til at afværge mulig korruption til vælgerlisterne rettidigt, " siger Alvarez. "Vores vision er at få alle stater til at uploade vælgerdata på daglig basis og at få algoritmer til at overvåge deres integritet."