Videnskab
 science >> Videnskab >  >> Elektronik

Computere bruger data på sociale medier til at forudsige kriminalitet

Kredit:CC0 Public Domain

I en undersøgelse offentliggjort i EPJ Data Science tidsskrift, holdet af RMIT-forskere viser, hvordan placerings- og aktivitetsdata fra brugere af Foursquare-appen, når det kombineres med anbefalingsalgoritmer, giver os mulighed for at forudsige forbrydelser mere præcist end nogensinde før.

Foursquare-brugere deler deres placering og aktivitet, når de 'checker ind' forskellige steder. Undersøgelsen brugte data fra over 20, 000 indtjekninger af brugere i Brisbane, og næsten 230, 000 indtjekninger af brugere i New York City.

RMIT datalog Dr. Flora Salim siger, at denne dynamik, Realtidsdata om menneskers bevægelser rundt i en by er yderst værdifulde for at forstå sandsynligheden for forskellige situationer i et område.

Men for at udfylde de mange huller i disse lokalitetsbaserede data, forskere udviklede også anbefalingsalgoritmer, svarende til dem, der bruges til at anbefale relaterede sange på Spotify.

"Det er klart, at det store flertal af mennesker i byen ikke altid brugte appen, og de, der begik forbrydelser, skrev sandsynligvis ikke om det på appen, " siger hun. "Så, vi brugte anbefalingssystemer til at udfylde hullerne og forudsige andre aktiviteter i et givet scenarie."

I test i begge byer, systemet forudsagde specifikke typer kriminalitet i bestemte dele af byen bedre end eksisterende kriminalitetsforudsigelsesmodeller baseret på kriminalitetstendenser.

I Brisbane, systemet viste sig at være 16 % mere nøjagtigt til at forudsige overfald end nuværende modeller, 6 % mere nøjagtig til at forudsige ulovlig indrejse, 4 % bedre for narkotikaforbrydelser og tyveri og 2 % bedre for forudsigelse af bedrageri.

I New York City, det forbedrede forudsigelsesnøjagtigheden med 4 % for tyveri og narkotikaforbrydelser, bedrageri og ulovlig indrejse, mens forudsigelserne om overfald forbedres med 2 %.

Salim siger, at i betragtning af de sparsomme datasæt, der blev brugt i undersøgelsen, disse resultater er væsentlige.

"Baseret på disse positive resultater, denne teknologi kunne give politiet mulighed for at designe mere effektive patruljestrategier med begrænsede ressourcer ved at sende betjente til de steder, hvor kriminalitet er mere sandsynlig, " hun siger.

Systemet kan også nemt skaleres op til at behandle større prøver fra næsten enhver social medieplatform, app eller mobilnetværk, der indsamler lokationsbaserede data.

"Den udbredte brug af sociale medier som Twitter og Foursquare - som alle samler enorme mængder data om vores placering, aktiviteter og præferencer – giver hidtil usete muligheder for at fange menneskers bevægelse og aktivitet på tværs af en by, " hun siger.

Undersøgelsen er blot et eksempel på, hvordan vores data kan bruges til at forudsige vores handlinger for en lang række applikationer.

Et andet projekt Salim er involveret i ser på algoritmer for at forudsige, med høj nøjagtighed, hvad vi vil gøre i anden halvdel af vores dag baseret på historiske mønstre og data indsamlet fra den første halvdel af vores dag.

"Forskning i mønsteret af menneskelig bevægelse, baseret på data fra vores mobilapps, viser ofte, hvor forudsigelige mange af vores aktiviteter er, " siger Salim.

Hovedforfatter og ph.d. studerende Shakila Khan Rumi, som er superviseret af Salim og Dr. Ke Deng, siger, at undersøgelsen markerer et væsentligt skridt fremad med hensyn til kriminalitetsforudsigelsesmodeller.

"Nuværende state-of-the-art kriminalitetsforudsigelsesmodeller er generelt afhængige af relative statiske træk, herunder langsigtede historiske oplysninger, geografisk information og demografisk information. Denne information ændrer sig langsomt over tid, hvilket betyder, at disse traditionelle modeller ikke kunne fange de kortsigtede variationer i hændelser af kriminalitet, " siger Rumi.

"Vores testresultater viser, at forbedringen af ​​forudsigelsesydelsen efter tilføjelse af dynamiske funktioner er betydelig og statistisk signifikant. Det er virkelig revolutionerende."

Gruppen planlægger nu at udvide arbejdet ved at træne algoritmerne ved at bruge data fra én by og øge dens evne til at anvende disse erfaringer i en anden by, hvor mønstrene er forskellige.


Varme artikler