Videnskab
 Science >> Videnskab >  >> Biologi

Rensselaer-teamet viser, hvordan man analyserer rå regeringsdata

Et team af forskere ved Rensselaer Polytechnic Institute har udviklet en ny måde at analysere rå regeringsdata på, hvilket gør det lettere for folk at forstå og bruge.

Holdet, ledet af professor i datalogi Jure Leskovec, skabte et system kaldet "Data Wrangler", der automatisk kan rense og transformere rå data til et format, der er mere tilgængeligt og brugbart.

"Rå regeringsdata er ofte rodet og svære at forstå," sagde Leskovec. "Vores mål var at skabe et værktøj, der kunne gøre disse data mere tilgængelige for folk, der ønsker at bruge dem til forskning, journalistik eller andre formål."

Data Wrangler arbejder ved at bruge en række forskellige maskinlærings- og naturlige sprogbehandlingsteknikker til at identificere og rette fejl i dataene, samt at udtrække meningsfuld information fra teksten.

Systemet kan bruges til at analysere en bred vifte af offentlige data, herunder økonomiske optegnelser, kriminalitetsstatistikker og miljødata.

Leskovec og hans team har allerede brugt Data Wrangler til at analysere flere store datasæt, herunder US Census Bureau's American Community Survey og New York City Police Departments stop-and-frisk-data.

Resultaterne af disse analyser er blevet offentliggjort i adskillige akademiske tidsskrifter og er blevet brugt af journalister og politiske beslutningstagere til at informere deres arbejde.

"Vi tror på, at Data Wrangler har potentialet til at revolutionere den måde, folk bruger regeringsdata på," sagde Leskovec. "Ved at gøre disse data mere tilgængelige og anvendelige, kan vi give folk mulighed for at træffe bedre beslutninger om deres liv og deres lokalsamfund."

Holdets forskning blev offentliggjort i tidsskriftet "Nature Machine Intelligence".