Skyer findes i alle former og størrelser, og nu kan en deep learning-model hjælpe med at opdage de finere detaljer i cloud-data. Kredit:Adriel Kloppenburg på Unsplash
Børn, der ligger på ryggen i en græsmark, kan scanne skyerne for billeder - måske en fluffy kanin her og en brændende drage derovre. Tit, Atmosfæriske videnskabsmænd gør det modsatte - de søger databilleder efter skyerne som en del af deres forskning for at forstå Jordens systemer.
Manuel mærkning af databilleder pixel for pixel er tidskrævende, så forskere er afhængige af automatiske behandlingsteknikker, såsom skydetektionsalgoritmer. Men algoritmernes output er ikke så nøjagtigt, som forskerne ønsker det skal være.
For nylig, forskere ved Department of Energy's Pacific Northwest National Laboratory gik sammen for at finde ud af, om deep learning - en særskilt undergruppe af maskinlæring - kan gøre et bedre stykke arbejde med at identificere skyer i lidar-data end de nuværende fysik-baserede algoritmer. Svaret:Et klart "ja." Den nye model er meget tættere på de svar, forskerne kommer frem til, men på kun en brøkdel af tiden.
Lidar er et fjernmålingsinstrument, der udsender en pulserende laser og opsamler retursignalet spredt tilbage af skydråber eller aerosoler. Dette retursignal giver information om højden og den lodrette struktur af atmosfæriske træk, såsom skyer eller røglag. Sådanne data fra jordbaserede lidarer er en vigtig del af globale prognoser.
Jordforsker Donna Flynn bemærkede, at i nogle tilfælde, hvad algoritmerne opdagede som skyer i lidarbillederne stemte ikke godt overens med det, hendes ekspertøje så. Algoritmerne har en tendens til at overvurdere skygrænserne.
"Den nuværende algoritme identificerer skyerne ved hjælp af brede penselstrøg, " siger Flynn, en co-principal investigator på projektet. "Vi er nødt til mere præcist at bestemme skyens sande top og base og at skelne flere skylag."
Opgradering påbegyndt
Indtil for nylig, kunstige neurale netværk med begrænset computerkraft, en form for dyb læringsmodel, til et lille antal beregningslag. Nu, med øget computerkraft tilgængelig gennem supercomputing-klynger, forskere kan bruge flere beregninger - hver bygning ud fra den sidste - i en række lag. Jo flere lag et kunstigt neuralt netværk har, jo stærkere er deep learning-netværket.
At finde ud af, hvad disse beregninger er, er en del af modeluddannelsen. At begynde, forskerne har brug for korrekt mærkede lidar-databilleder, eller "grundsandhed"-data, til træning og test af modellen. Så, Flynn brugte mange lange timer på at håndmærke billeder pixel for pixel:sky eller ingen sky. Hendes øje kan skelne skygrænserne og sky versus et aerosollag. Hun tog 40 timer - svarende til en hel arbejdsuge - til at mærke omkring 100 dages lidardata indsamlet på det sydlige Great Plains atmosfæriske observatorium, del af DOE's brugerfacilitet til atmosfærisk strålingsmåling, i Oklahoma.
I betragtning af hvor tids- og arbejdskrævende håndmærkningsprocessen er, PNNL beregningsforsker og co-principal investigator Erol Cromwell brugte læringsmetoder, der krævede minimale grundsandhedsdata.
Modellen lærer gennem selvfeedback. Den sammenligner sin egen ydeevne med håndmærkede resultater og justerer sine beregninger i overensstemmelse hermed, forklarer Cromwell. Den gennemgår disse trin, forbedres hver gang.
Cromwell vil præsentere holdets resultater på Institute of Electrical and Electronics Engineers Winter Conference on Applications of Computer Vision i januar.
Mål nået
Med uddannelsen, den dybe læringsmodel overgår de nuværende algoritmer. Modellens præcision er næsten dobbelt og meget tættere på, hvad en menneskelig ekspert ville finde - men på en brøkdel af tiden.
De næste trin er at evaluere modellens ydeevne på lidar-data indsamlet på forskellige steder og på forskellige årstider. Indledende test af data fra ARM-observatoriet ved Oliktok Point i Alaska er lovende.
"En fordel ved deep learning -modellen er transfer learning, " siger Cromwell. "Vi kan træne modellen yderligere med data fra Oliktok for at gøre dens ydeevne mere robust."
"Reduktion af kilder til usikkerhed i globale modelforudsigelser er især vigtigt for det atmosfæriske videnskabssamfund, " siger Flynn. "Med sin forbedrede præcision, dyb læring øger vores selvtillid."
Hun tilføjer:"Plus det giver os mere tid til at være udenfor og se på rigtige skyer!"