Holdet, ledet af professor i datalogi Jure Leskovec, skabte et system kaldet "Data Wrangler", der automatisk kan rense og transformere rå data til et format, der er mere tilgængeligt og brugbart.
"Rå regeringsdata er ofte rodet og svære at forstå," sagde Leskovec. "Vores mål var at skabe et værktøj, der kunne gøre disse data mere tilgængelige for folk, der ønsker at bruge dem til forskning, journalistik eller andre formål."
Data Wrangler arbejder ved at bruge en række forskellige maskinlærings- og naturlige sprogbehandlingsteknikker til at identificere og rette fejl i dataene, samt at udtrække meningsfuld information fra teksten.
Systemet kan bruges til at analysere en bred vifte af offentlige data, herunder økonomiske optegnelser, kriminalitetsstatistikker og miljødata.
Leskovec og hans team har allerede brugt Data Wrangler til at analysere flere store datasæt, herunder US Census Bureau's American Community Survey og New York City Police Departments stop-and-frisk-data.
Resultaterne af disse analyser er blevet offentliggjort i adskillige akademiske tidsskrifter og er blevet brugt af journalister og politiske beslutningstagere til at informere deres arbejde.
"Vi tror på, at Data Wrangler har potentialet til at revolutionere den måde, folk bruger regeringsdata på," sagde Leskovec. "Ved at gøre disse data mere tilgængelige og anvendelige, kan vi give folk mulighed for at træffe bedre beslutninger om deres liv og deres lokalsamfund."
Holdets forskning blev offentliggjort i tidsskriftet "Nature Machine Intelligence".
Sidste artikelDu er ikke, hvad du spiser
Næste artikelTests viser lys fremtid for gadonanorør i stamcellesporing