Jiali Wang og Rao Kotamarthi, sammen med Prasanna Balaprakash, var medforfattere til den geovidenskabelige modeludvikling, der fokuserede på det planetariske grænselag. Kredit:Argonne National Laboratory
Når du tjekker vejrudsigten om morgenen, de resultater, du ser, er mere end sandsynligt bestemt af Weather Research and Forecasting-modellen (WRF), en omfattende model, der simulerer udviklingen af mange aspekter af den fysiske verden omkring os.
"Det beskriver alt, hvad du ser uden for dit vindue, " sagde Jiali Wang, en miljøforsker ved U.S. Department of Energy's (DOE) Argonne National Laboratory, "fra skyerne, til solens stråling, til sne til vegetation - selv den måde skyskrabere forstyrrer vinden."
De utallige karakteristika og årsager til vejr og klima er koblet sammen, kommunikerer med hinanden. Forskere har endnu ikke fuldt ud beskrevet disse komplekse forhold med simple, forenede ligninger. I stedet, de tilnærmer ligningerne ved hjælp af en metode kaldet parametrisering, hvor de modellerer relationerne i en skala, der er større end de faktiske fænomeners.
Selvom parameteriseringer forenkler fysikken på en måde, der gør det muligt for modellerne at producere relativt nøjagtige resultater på en rimelig tid, de er stadig beregningsmæssigt dyre. Miljøforskere og beregningsforskere fra Argonne samarbejder om at bruge dybe neurale netværk, en form for maskinlæring, at erstatte parametreringen af visse fysiske skemaer i WRF-modellen, reducere simuleringstiden markant.
"Med mindre dyre modeller, vi kan opnå simuleringer i højere opløsning for at forudsige, hvordan kortsigtede og langsigtede ændringer i vejrmønstre påvirker den lokale skala, " sagde Wang, "selv ned til kvarterer eller specifik kritisk infrastruktur."
I en nylig undersøgelse, forskerne fokuserede på det planetariske grænselag (PBL), eller laveste del af atmosfæren. PBL er det atmosfæriske lag, som menneskelig aktivitet påvirker mest, og den strækker sig kun et par hundrede meter over Jordens overflade. Dynamikken i dette lag, såsom vindhastighed, temperatur- og luftfugtighedsprofiler, er afgørende for at bestemme mange af de fysiske processer i resten af atmosfæren og på Jorden.
PBL er en afgørende komponent i WRF-modellen, men det er også en af de mindst beregningsmæssigt dyre. Dette gør det til et glimrende teststed til at studere, hvordan mere komplicerede komponenter kan forbedres af deep learning neurale netværk på samme måde.
"Vi brugte 20 års computergenererede data fra WRF-modellen til at træne de neurale netværk og to års data til at evaluere, om de kunne give et præcist alternativ til de fysikbaserede parametriseringer, " sagde Prasanna Balaprakash, en datalog og modtager af DOE Early Career Award i Argonne's Mathematics and Computer Science division og Argonne Leadership Computing Facility (ALCF), en DOE Office of Science brugerfacilitet.
Balaprakash udviklede det neurale netværk og trænede det til at lære et abstrakt forhold mellem input og output ved at fodre det med mere end 10, 000 datapunkter (8 pr. dag) fra to lokationer, en i Kansas og en i Alaska. Resultatet var en algoritme, som forskerne er sikre på kan erstatte PBL-parameteriseringen i WRF-modellen.
Forskerne demonstrerede, at et dybt neuralt netværk, der overvejer noget af den underliggende struktur af forholdet mellem input- og outputvariablerne, med succes kan simulere vindhastigheder, temperatur og vanddamp over tid. Resultaterne viser også, at et trænet neuralt netværk fra ét sted kan forudsige adfærd på tværs af nærliggende steder med korrelationer højere end 90 procent sammenlignet med testdataene.
"Samarbejdet mellem klimaforskerne og datalogerne var afgørende for de resultater, vi opnåede, " sagde Rao Kotamarthi, chefforsker og afdelingsleder for atmosfærisk videnskab og klimaforskning i Argonnes Environmental Science-afdeling. "Ved at inkorporere vores domæneviden bliver algoritmen meget mere forudsigelig."
Algoritmerne - kaldet domænebevidste neurale netværk - der tager højde for kendte sammenhænge, kan ikke kun forudsige miljødata mere præcist, men de kræver også træning af væsentligt færre data end algoritmer, der ikke tager domæneekspertise i betragtning.
Ethvert maskinlæringsprojekt kræver en stor mængde data af høj kvalitet, og der var ingen mangel på data til denne undersøgelse. Supercomputing ressourcer ved ALCF og National Energy Research Scientific Computing Center, en DOE Office of Science User Facility ved Lawrence Berkeley National Laboratory, bidraget til produktionen af mere end 300 år (700 terabyte) af data, der beskriver tidligere, nuværende og fremtidige vejr og klima i Nordamerika.
"Denne database er unik for klimavidenskaben i Argonne, " sagde Wang, "og vi bruger det til at udføre yderligere undersøgelser i deep learning og bestemme, hvordan det kan anvendes på klimamodeller."
Forskernes ultimative mål er at erstatte alle de dyre parameteriseringer i WRF-modellen med deep learning neurale netværk for at muliggøre hurtigere og højere opløsningssimulering.
I øjeblikket, holdet arbejder på at efterligne langbølget og kortbølget solstrålingsparameterisering - to dele af WRF-modellen, der tilsammen fylder næsten 40 % af fysikkens beregningstid i simuleringerne.
Resultaterne af undersøgelsen blev offentliggjort i et papir med titlen "Hurtig domænebevidst neural netværksemulering af en planetarisk grænselagsparameterisering i en numerisk vejrudsigtsmodel" den 10. oktober i Geovidenskabelig modeludvikling 12, 4261-4274, 2019.