Videnskab
 science >> Videnskab >  >> Elektronik

Elever hjælper NASA med at finde jordskred ved at træne computere til at læse Reddit

Ifølge Verdenssundhedsorganisationen er jordskred mere udbredte end nogen anden geologisk begivenhed. Kredit:NASA

University of British Columbia kandidatstuderende har trænet computere til at "læse" nyhedsartikler om jordskred på Reddit for at styrke en NASA-database, som kunne forbedre forudsigelserne om, hvornår og hvor disse naturkatastrofer vil forekomme.

Til deres Master of Data Science in Computational Linguistics-hovedstensprojekt trænede Badr Jaidi og hans team, Social Jordslides-gruppen, computere til automatisk at udtrække nyttig information fra relevante nyhedsartikler om jordskred, der blev sendt til Reddit. I denne Q&A diskuterer han, hvordan dette værktøj kan ende med at redde liv.

Hvorfor har vi brug for dette værktøj?

Ifølge Verdenssundhedsorganisationen er jordskred mere udbredte end nogen anden geologisk begivenhed. De er så ødelæggende, og vi har ikke så mange data om dem. Jo mere nøjagtige jordskreddata du har, jo mere er det muligt præcist at forudsige, hvilke steder der har højere risiko, hvilket i sidste ende kan redde liv.

NASA indsamler sådanne oplysninger i en offentlig database kaldet Cooperative Open Online Repository, eller COOLR, og bruger dette til at forudsige, hvornår og hvor jordskred vil forekomme. Men folk har måttet manuelt indsende jordskredsinformation eller søge efter nyhedsartikler og data én efter én, hvilket er ret kedeligt. Vores værktøj automatiserer denne proces og fuldender på få minutter, hvad der tidligere kunne have taget måneder.

Det ville frigøre ressourcer til vigtigere forskning og ville også betyde, at vi får flere data, hurtigere, potentielt forbedre forskningen i jordskred generelt, såvel som NASA's jordskredsforudsigelser.

Hvordan fungerer det?

Vejledt af BGC Engineering Inc. og NASA til vores hovedstensprojekt designet vores team et værktøj, der scanner Reddit for nyhedsartikler om jordskred inden for en given tidsperiode og derefter udtrækker relevant information.

Først regner en computermodel ud af, om artiklen faktisk handler om jordskred, snarere end at sige, et valg, hvor nogen vinder "med et jordskred", eller som vi også fandt, artikler om Pokémon med jordteknikker som "klippeskred."

Derefter trænede vi en naturlig sprogbehandlingsmodel på jordskreddata, og lærte den at genkende den information, vi ønskede fra en artikel. Denne type model kan forstå sprog, herunder analysere sætninger. Så vi ville give den en nyhedsartikel og spørge, hvor et jordskred kunne være sket. Modellen ville forudsige svaret baseret på det involverede sprog, f.eks. "Skredet skete højst sandsynligt her, ifølge denne sætning," og vi ville lade det vide, om det var korrekt eller ej.

På denne måde lærer computeren, hvilken information der automatisk og præcist skal udtrækkes, herunder hvornår et jordskred skete, og hvor, hvad der forårsagede det, og hvor mange dræbte der var involveret.

Det hele sker ret hurtigt:Det returnerer en måneds artikler på cirka 15 minutter sammenlignet med at gå igennem dem manuelt for at finde disse oplysninger. Dataene kan derefter føres ind i COOLR. Det tog os omkring to måneder at bygge. NASA er i øjeblikket ved at vurdere, om værktøjet kan køres som det er, eller det skal justeres for at bruge det.

Kunne værktøjet bruges på andre sociale medier?

Vi brugte Reddit, fordi det er gratis at få adgang til deres applikationsprogrammeringsgrænseflade (API). For eksempel har Twitters API en masse begrænsninger, og det er ret dyrt at få adgang til. Desuden ville mængden af ​​data være enorm.

Vi ville starte i det små og bevise, at det virker med Reddit. Men det kunne udvides til større platforme og kilder, forudsat at de har nyhedsartikler. Du kan endda udvide værktøjet til at bruge det til andre katastrofer, såsom jordskælv, ved at bruge den samme metode ved at træne modellerne med lignende datasæt.

At forbedre modellen og tilføje flere kilder, som andre jordskred kan udvindes fra end Reddit, ville i sidste ende hjælpe NASA med at få flere datapunkter hurtigere. Jeg holder øje med det. + Udforsk yderligere

Forskere opgraderer den internationale nomenklatur for jordskredgeometri




Varme artikler