Et detaljeret kort over forureningsniveauerne i Beijing og dets omkringliggende områder ved hjælp af en ny maskinlæringsalgoritme til satellitbilleder og vejr. Kredit:Tongshu Zheng, Duke University
Forskere fra Duke University har udtænkt en metode til at estimere luftkvaliteten over et lille stykke land ved hjælp af intet andet end satellitbilleder og vejrforhold. Sådan information kan hjælpe forskere med at identificere skjulte hotspots af farlig forurening, i høj grad forbedre undersøgelser af forurening på menneskers sundhed, eller potentielt drille virkningerne af uforudsigelige begivenheder på luftkvaliteten, såsom udbruddet af en luftbåren global pandemi.
Resultaterne vises online i journalen Atmosfærisk miljø .
"Vi har brugt en ny generation af mikro-satellitbilleder til at estimere luftforurening på jordniveau i den mindste rumlige skala til dato, " sagde Mike Bergin, professor i civil- og miljøteknik ved Duke. "Vi har været i stand til at gøre det ved at udvikle en helt ny tilgang, der bruger AI/machine learning til at fortolke data fra overfladebilleder og eksisterende jordstationer."
Den specifikke luftkvalitetsmåling, som Bergin og hans kolleger er interesserede i, er mængden af små luftbårne partikler kaldet PM2.5. Disse er partikler, der har en diameter på mindre end 2,5 mikrometer - omkring tre procent af diameteren af et menneskehår - og har vist sig at have en dramatisk effekt på menneskers sundhed på grund af deres evne til at rejse dybt ned i lungerne.
For eksempel, PM2.5 blev globalt rangeret som den femte dødelighedsrisikofaktor, ansvarlig for omkring 4,2 millioner dødsfald og 103,1 millioner leveår mistet eller levet med handicap, af 2015 Global Burden of Disease-undersøgelsen. Og i en nylig undersøgelse fra Harvard University T.H. Chan School of Public Health, forskere fandt, at områder med højere niveauer af PM2.5 også er forbundet med højere dødsrater på grund af COVID-19.
Nuværende bedste praksis inden for fjernmåling til at estimere mængden af jordniveau PM2.5 bruger satellitter til at måle, hvor meget sollys, der spredes tilbage til rummet af omgivende partikler over hele den atmosfæriske søjle. Denne metode, imidlertid, kan lide af regionale usikkerheder såsom skyer og skinnende overflader, atmosfærisk blanding, og egenskaber af PM-partiklerne, og kan ikke foretage nøjagtige skøn på skalaer mindre end omkring en kvadratkilometer. Mens jordforureningsovervågningsstationer kan levere direkte målinger, de lider under deres egne væld af ulemper og er kun sparsomt placeret rundt om i verden.
"Jordstationer er dyre at bygge og vedligeholde, så selv store byer vil sandsynligvis ikke have mere end en håndfuld af dem, " sagde Bergin. "Plus de er næsten altid placeret i områder væk fra trafik og andre store lokale kilder, så selvom de måske giver en generel idé om mængden af PM2,5 i luften, de kommer ikke i nærheden af at give en sand fordeling for de mennesker, der bor i forskellige områder i den by."
I deres søgen efter en bedre metode, Bergin og hans doktorand Tongshu Zheng vendte sig mod Planet, et amerikansk firma, der bruger mikrosatellitter til at tage billeder af hele Jordens overflade hver eneste dag med en opløsning på tre meter per pixel. Holdet var i stand til at få et dagligt øjebliksbillede af Beijing i løbet af de sidste tre år.
Det vigtigste gennembrud kom, da David Carlson, en assisterende professor i civil- og miljøteknik hos Duke og en ekspert i maskinlæring, trådte til for at hjælpe.
Seks forskellige billeder taget af det samme område i Beijing på forskellige dage, hvor de oplever forskellige niveauer af luftforurening. Mens det blotte menneskelige øje tydeligt kan se, at nogle dage er mere forurenede end andre, en ny maskinlæringsalgoritme kan lave rimeligt nøjagtige skøn over luftforurening på jordniveau. Kredit:Tongshu Zheng, Duke University
"Når jeg går til konferencer om maskinlæring og kunstig intelligens, Jeg er normalt den eneste person fra en miljøteknisk afdeling, " sagde Carlson. "Men det er de nøjagtige typer projekter, som jeg er her for at hjælpe med at støtte, og hvorfor Duke lægger så stor vægt på at ansætte dataeksperter på hele universitetet."
Med Carlsons hjælp, Bergin og Zheng anvendte et konvolutionelt neuralt netværk med en tilfældig skovalgoritme til billedsættet, kombineret med meteorologiske data fra Beijings vejrstation. Selvom det kan lyde som en mundfuld, det er ikke så svært at finde vej gennem træerne.
En tilfældig skov er en standard maskinlæringsalgoritme, der bruger en masse forskellige beslutningstræer til at lave en forudsigelse. Vi har alle set beslutningstræer, måske som et internet-meme, der bruger en række forgrenede ja/nej-spørgsmål til at beslutte, om man skal spise en burrito eller ej. Bortset fra i dette tilfælde, Algoritmen kigger gennem beslutningstræer baseret på målinger såsom vind, relativ luftfugtighed, temperatur og mere, og ved at bruge de resulterende svar til at nå frem til et estimat for PM2,5-koncentrationer.
Imidlertid, tilfældige skovalgoritmer håndterer ikke billeder godt. Det er her, de foldede neurale netværk kommer ind i billedet. Disse algoritmer leder efter fælles træk i billeder såsom linjer og bump og begynder at gruppere dem sammen. Når algoritmen "zoomer ud, "det fortsætter med at klumpe lignende grupperinger sammen, kombinerer grundlæggende former til fælles funktioner såsom bygninger og motorveje. Til sidst kommer algoritmen med en oversigt over billedet som en liste over dets mest almindelige funktioner, og disse bliver smidt ind i den tilfældige skov sammen med vejrdataene.
"Billeder med høj forurening er bestemt mere tågede og slørere end normale billeder, men det menneskelige øje kan ikke rigtig se de nøjagtige forureningsniveauer ud fra disse detaljer, " sagde Carlson. "Men algoritmen kan udvælge disse forskelle i både lavniveau- og højniveaufunktionerne - kanter er mere slørede og former sløres mere - og præcist omdanne dem til luftkvalitetsestimater."
"Det konvolutionelle neurale netværk giver os ikke så god forudsigelse, som vi gerne ville med billederne alene, " tilføjede Zheng. "Men når du placerer disse resultater i en tilfældig skov med vejrdata, resultaterne er lige så gode som alt andet tilgængeligt i øjeblikket, hvis ikke bedre."
I undersøgelsen, forskerne brugte 10, 400 billeder til at træne deres model til at forudsige lokale niveauer af PM2.5 ved hjælp af intet andet end satellitbilleder og vejrforhold. De testede deres resulterende model på yderligere 2, 622 billeder for at se, hvor godt det kunne forudsige PM2.5.
De viser, at gennemsnitlig, deres model er nøjagtig inden for 24 procent af de faktiske PM2.5-niveauer målt på referencestationer, som er i den høje ende af spektret for disse typer modeller, samtidig med at den har en meget højere rumlig opløsning. Mens de fleste af de nuværende standardpraksis kan forudsige niveauer ned til 1 million kvadratmeter, den nye metode er nøjagtig ned til 40, 000 — på størrelse med otte fodboldbaner placeret side om side.
Med det niveau af specificitet og nøjagtighed, Bergin mener, at deres metode vil åbne op for en lang række nye anvendelser for sådanne modeller.
"Vi mener, at dette er en enorm innovation inden for satellitgenfinding af luftkvalitet og vil være rygraden i en masse forskning, der kommer, " sagde Bergin. "Vi er allerede begyndt at få forespørgsler om at bruge det til at se på, hvordan niveauer af PM2.5 vil ændre sig, når verden begynder at komme sig efter spredningen af COVID-19."