Videnskab
 science >> Videnskab >  >> Elektronik

Model smelter sociale medier, fjernmålingsdata med det formål at identificere nukleare trusler

Kredit:CC0 Public Domain

En ny beregningsmodel giver forskere mulighed for at trække på normalt inkompatible datasæt, såsom satellitbilleder og opslag på sociale medier, at besvare spørgsmål om, hvad der sker på målrettede steder. Forskerne udviklede modellen til at tjene som et værktøj til at identificere overtrædelser af nukleare ikke-spredningsaftaler.

"Vores mål var at udvikle en arbejdsramme, der bruger information fra en række sensorer og datakilder til at identificere disse potentielle krænkelser af nuklear ikke-spredning, " siger Hamid Krim, medforfatter til et papir om værket, en professor i elektro- og computerteknik ved North Carolina State University og direktør for VISSTA Laboratory. "Nogle af disse data kan være konventionelle, såsom geigertælleraflæsninger eller multispektrale data fra satellitbilleder. Men mange af disse datakilder kan være utraditionelle, såsom opslag på sociale medier. Og disse kilder giver en bred vifte af data, der normalt ikke er kompatible, såsom teksten inkluderet på Twitter-opslag og billederne på Flickr.

"Ved at gøre disse forskellige input kompatible med hinanden, vi er i stand til at acceptere en bredere vifte af datainput og bruge disse data på en meningsfuld måde, ultimativt, kan hjælpe myndigheder med at nå mere pålidelige konklusioner, " siger Krim.

Forskerne siger, at modellen kan bruges til at arbejde med alle data, der kan identificeres som kommer fra det målrettede område. For eksempel, satellitbilleder er klart identificerbare, men de kan også trække på opslag på sociale medier, der aktivt eller passivt er tagget som værende fra det relevante område.

Spørgsmålet bliver så:hvordan arbejder du med inkompatible data? At forklare, vi vil bruge et proxy-problem, som forskerne brugte i deres papir:at identificere en oversvømmelse. De valgte en oversvømmelse, fordi data om oversvømmelser ikke er klassificeret, der henviser til, at data vedrørende atomaktivitet er.

Det første trin i processen er at bruge matematiske ligninger til at oversætte hver type data til et nyttigt format. For eksempel, billeder kan køres gennem modeller for at afgøre, om det er billeder af oversvømmelser, der henviser til, at tekstposter kan køres gennem modeller for at afgøre, om de indeholder referencer til oversvømmelser. Når disse datastrømme er oversat til et neutralt format - hvilket betyder, at de indikerer oversvømmelse eller ingen oversvømmelse - kan de sammenlignes med hinanden for at besvare grundlæggende spørgsmål som:understøtter dataene hinanden?

Men det er ikke helt så enkelt. For eksempel, folk kan tweete om en oversvømmelse, der finder sted flere hundrede kilometer væk, hvilket kunne skævvride enhver beregning ved den overordnede model. For at løse dette, forskerne inkorporerede matematiske elementer, der forklarer kompleksiteten af ​​de data, de trækker på.

"At håndtere kompleksitet er særligt vigtigt i forbindelse med håndhævelse af ikke-spredning, " siger Krim. "Relevante datainput kan omfatte fotos af bestemte typer teknologi, referencer i samtaler fanget på lyd, og så videre. En model som den, vi udviklede, skal være fleksibel nok til at tage højde for variabiliteten og kompleksiteten af ​​både forskellige typer data og de forskellige spor, vi leder efter."

Forskerne testede deres model ved hjælp af data fra en oversvømmelse i 2013, der fandt sted i Colorado, og var i stand til at løse inkompatibiliteten mellem multimodale data for nøjagtigt at estimere placeringen af ​​oversvømmelsen.

De næste trin for projektet omfatter evaluering af nukleare anlæg i Vesten for at identificere fælles karakteristika, som også kan være anvendelige for anlæg i mere isolerede samfund, såsom Nordkorea.

"Vi ønsker at finde måder at overføre information fra kendt miljø til et skjult miljø, " siger Krim. "Hvordan kan vi bestemme, hvilken information og hvilke modeller der kan overføres fra et sted til et andet, givet inkompatible eller inkonsekvente data? Hvad er normalt, og hvad er det ikke? Det er ikke et let problem."


Varme artikler