Videnskab
 science >> Videnskab >  >> Natur

Stanford-studerende implementerer maskinlæring for at hjælpe med miljøovervågning

Billedtekst:Satellitbilleder af flodens udstrømning til Atlanterhavet i kølvandet på orkanen Florence viser vand misfarvet af affald og forurenende stoffer. Kredit:NASA

Da orkanen Florence jordede sig gennem North Carolina, det udløste, hvad man høfligt kunne kalde en ekskrementstorm. Massive svinegårdsgødningsbassiner skyllede en gryderet af farlige bakterier og tungmetaller ud i nærliggende vandveje.

Mere effektivt tilsyn kunne have forhindret nogle af de værste effekter, men selv i de bedste tider, statslige og føderale miljøtilsynsmyndigheder er overudstrakte og underfinansierede. Hjælp er lige ved hånden, imidlertid, i form af maskinlæring – træning af computere til automatisk at detektere mønstre i data – ifølge Stanford-forskere.

Deres studie, udgivet i Naturens bæredygtighed , finder, at maskinlæringsteknikker kunne fange to til syv gange så mange overtrædelser som nuværende tilgange, og foreslår vidtgående ansøgninger om offentlige investeringer.

"Især i en tid med faldende budgetter, at identificere omkostningseffektive måder at beskytte folkesundheden og miljøet på er afgørende, " sagde studiemedforfatter Elinor Benami, en kandidatstuderende i Emmett Interdisciplinary Program on Environment and Resources (E-IPER) i Stanford's School of Earth, Energi- og miljøvidenskab.

Optimering af ressourcer

Ligesom IRS ikke kan revidere alle skatteydere, de fleste offentlige myndigheder skal hele tiden træffe beslutninger om, hvordan ressourcerne skal fordeles. Maskinlæringsmetoder kan hjælpe med at optimere denne proces ved at forudsige, hvor midlerne kan give størst fordel. Forskerne fokuserede på Clean Water Act, hvorunder U.S. Environmental Protection Agency og delstatsregeringer er ansvarlige for at regulere mere end 300, 000 faciliteter, men er i stand til at inspicere mindre end 10 procent af dem i et givet år.

Brug af data fra tidligere inspektioner, forskerne implementerede en række modeller til at forudsige sandsynligheden for at mislykkes en inspektion, baseret på faciliteternes karakteristika, såsom placering, industri og inspektionshistorie. Derefter, de kørte deres modeller på alle faciliteter, inklusive dem, der endnu ikke skulle inspiceres.

Denne teknik genererede en risikoscore for hver facilitet, angiver, hvor sandsynligt det var at mislykkes en inspektion. Gruppen oprettede derefter fire inspektionsscenarier, der afspejler forskellige institutionelle begrænsninger – varierende inspektionsbudgetter og inspektionsfrekvenser, for eksempel - og brugte scoren til at prioritere inspektioner og forudsige overtrædelser.

Under scenariet med de færreste begrænsninger - usandsynligt i den virkelige verden - forudsagde forskerne at indhente op til syv gange antallet af overtrædelser sammenlignet med status quo. Da de stod for flere begrænsninger, antallet af opdagede overtrædelser var stadig det dobbelte af status quo.

Grænser for algoritmer

På trods af dets potentiale, maskinlæring har fejl at beskytte sig imod, advarer forskerne. "Algorithmer er uperfekte, de kan til tider opretholde bias, og de kan spilles, " sagde studielederforfatter Miyuki Hino, også kandidatstuderende i E-IPER.

For eksempel, agenter, sådanne svinegårdsejere, kan manipulere deres rapporterede data for at påvirke sandsynligheden for at modtage fordele eller undgå sanktioner. Andre kan ændre deres adfærd - afslappende standarder, når risikoen for at blive fanget er lav - hvis de kender deres sandsynlighed for at blive udvalgt af algoritmen. institutionelle, politiske og økonomiske begrænsninger kunne begrænse maskinlærings evne til at forbedre eksisterende praksis. Fremgangsmåden kan potentielt forværre bekymringer om miljøretfærdighed, hvis den systematisk leder tilsynet væk fra faciliteter beliggende i lavindkomst- eller minoritetsområder. Også, maskinlæringstilgangen tager ikke højde for potentielle ændringer over tid, såsom i offentlige politiske prioriteter og forureningskontrolteknologier.

Forskerne foreslår løsninger på nogle af disse udfordringer. at vælge nogle faciliteter tilfældigt, uanset deres risikoresultater og lejlighedsvis genoptræning af modellen til at afspejle opdaterede risikofaktorer kan hjælpe med at holde lavrisikofaciliteter på tæerne med hensyn til overholdelse. Bekymringer om miljøretfærdighed kunne indbygges i praksis for inspektionsmålretning. At undersøge værdien og afvejningen ved at bruge selvrapporterede data kan hjælpe med at håndtere bekymringer om strategisk adfærd og manipulation fra faciliteter.

Forskerne foreslår, at fremtidigt arbejde kan undersøge yderligere kompleksiteter ved at integrere en maskinlæringstilgang i EPA's bredere håndhævelsesindsats, såsom at indarbejde specifikke håndhævelsesprioriteter eller identificere tekniske, økonomiske og menneskelige ressourcer. Ud over, disse metoder kan anvendes i andre sammenhænge i USA og udenfor, hvor regulatorer søger at gøre effektiv brug af begrænsede ressourcer.

"Denne model er et udgangspunkt, der kunne udvides med flere detaljer om omkostninger og fordele ved forskellige inspektioner, krænkelser og håndhævelsesreaktioner, " sagde medforfatter og kollega E-IPER kandidatstuderende Nina Brooks.


Varme artikler