Modellering af skyer, især i små skalaer, kan være svært for videnskabsmænd. Kredit:NASA Goddard Space Flight Center
I dag, at forudsige, hvad fremtiden har i vente for Jordens klima, betyder at håndtere usikkerheder. For eksempel, de centrale klimafremskrivninger fra det mellemstatslige panel om klimaændringer (IPCC) har sat det globale temperaturbump fra en fordobling af atmosfærisk CO2 2 niveauer - kaldet "klimafølsomhed" - overalt mellem 1,5 grader C og 4,5 C. Det hul, som ikke har rykket sig siden den første IPCC-rapport i 1990, har dybtgående konsekvenser for den type miljøbegivenheder, menneskeheden måske ønsker at forberede sig på.
En del af usikkerheden opstår på grund af utvungen variabilitet - ændringer, der ville forekomme selv i fravær af stigninger i CO 2 - men en del af det opstår på grund af behovet for modeller til at simulere komplekse processer som skyer og konvektion. For nylig, klimaforskere har forsøgt at indsnævre omfanget af usikkerheden i klimamodeller ved at bruge en nylig revolution inden for datalogi. Maskinelæring, som allerede er ved at blive implementeret til et væld af applikationer (drug discovery, luft trafik kontrol, og stemmegenkendelsessoftware, for eksempel), udvider nu til klimaforskning, med det mål at reducere usikkerheden i klimamodeller, specifikt hvad angår klimafølsomhed og forudsigelse af regionale tendenser, to af usikkerhedens største syndere.
Paul O'Gorman, en lektor i MIT Department of Earth, Atmosfærisk og planetarisk videnskab (EAPS) og medlem af programmet i atmosfærer, Oceaner og klima, diskuterer, hvor maskinlæring passer ind i klimamodellering, mulige faldgruber og deres retsmidler, og områder, hvor tilgangen sandsynligvis vil have størst succes.
Spørgsmål:Klimafølsomhed og regionale ændringer i klimaet ser ud til at være en kilde til frustration for forskere. Hvad er forhindringerne der, og hvordan kan maskinlæring hjælpe?
A:Nutidens klimamodeller er allerede meget nyttige på den ene side, men de står også over for meget udfordrende problemer, hvoraf to du nævnte – klimafølsomhed for en fordobling af kuldioxid og regionale aspekter af ændringer i klimaet, for eksempel, hvordan nedbøren ændrer sig i et bestemt land. For begge disse spørgsmål vil vi gerne have mere præcise klimamodeller, og de skal også være hurtige, fordi de skal køres i mere end tusind år, typisk, bare for at få dem ind i den nuværende klimatilstand, før de går videre ind i fremtidige klimaer.
Så det er et spørgsmål om både nøjagtighed og effektivitet. Traditionelt, klimamodeller er i høj grad baseret på atmosfærens og havets fysik og kemi, og processer på landoverfladen. Men de kan ikke inkludere alt, hvad der sker i atmosfæren ned til millimeterskalaen eller mindre, så de skal inkludere nogle empiriske formler. Og de empiriske formler kaldes parameteriseringer. Parameteriseringer repræsenterer komplekse processer, som skyer og atmosfærisk konvektion - et eksempel på dette ville være tordenvejr - der sker i små skalaer sammenlignet med jordens størrelse, så de er svære for globale klimamodeller at repræsentere nøjagtigt.
En idé, der er kommet frem i de sidste par år, er at bruge maskinlæring til mere præcist at repræsentere disse små aspekter af atmosfæren og havet. Ideen ville være at køre en meget dyr, højopløsningsmodel, der kan løse den proces, du er interesseret i, for eksempel, lavvandede skyer, og brug derefter maskinlæring til at lære af disse simuleringer. Det er det første skridt. Det andet trin ville være at inkorporere den maskinlærte algoritme i en klimamodel for at give, forhåbentlig, en hurtigere og mere præcis klimamodel. Og det er, hvad flere grupper rundt om i verden udforsker.
Spørgsmål:I hvilket omfang kan den maskinlærte algoritme generalisere fra én klimasituation, eller en region, til en anden?
A:Det er et stort spørgsmålstegn. Hvad vi har fundet indtil videre er, at hvis du træner på det nuværende klima og derefter prøver at simulere et meget varmere klima, maskinlæringsalgoritmen vil mislykkes, fordi den er afhængig af analogier til situationer i det nuværende klima, der ikke strækker sig til det varmere klima med højere temperaturer. For eksempel, skyer i atmosfæren har en tendens til at gå højere i et varmere klima. Så det er en begrænsning, hvis du kun træner på det nuværende klima, men det er selvfølgelig også muligt at træne i varmere klimaer i modeller med høj opløsning.
Interessant nok, vi fandt for atmosfærisk konvektion, at hvis du træner på det nuværende klima og derefter går til et koldere klima, maskinindlæringsmetoden fungerer godt. Så der er en asymmetri mellem opvarmning eller afkøling, og hvor godt disse algoritmer kan generalisere, i det mindste for atmosfærisk konvektion. Grunden til, at maskinlæringsalgoritmen kan generalisere i tilfælde af et kølende klima, er, at den kan finde eksempler på højere breddegrader i det nuværende klima for at matche troperne i det koldere klima. Så forskellige klimaer i forskellige regioner af verden hjælper med at generalisere klimaændringer.
Den anden ting, der kan hjælpe, er begivenheder som El Niño, hvor den globale atmosfære i gennemsnit bliver en smule varmere, og så det kunne give en analogi at lære af. Det er ikke en perfekt analogi med global opvarmning, men nogle af den samme fysik fungerer muligvis ved højere temperaturer, så det kunne være noget, som maskinlæringsalgoritmen automatisk ville udnytte til at hjælpe med at generalisere til varmere klimaer.
Q:Does that mean there are certain areas of the climate system that machine learning will work better for versus others?
A:I was suggesting that we should train our machine learning algorithms on very expensive high-resolution simulations, but that only makes sense, selvfølgelig, if we have accurate high-resolution simulations for the process we are interested in. What we've been studying—atmospheric convection—is a good candidate because we can do quite accurate high-resolution simulations.
På den anden side, if one was interested in, for eksempel, how the land surface responds to climate change and how it interacts with the atmosphere above it, it's more difficult because there's lots of complexity. We have different types of plants, different soil. It's very heterogeneous. It's not as straightforward to get the truth from which you want to learn from models in that case. And then if we say, "Godt, for aspects of the climate system that don't have accurate expensive simulations, can we instead use observations?" Perhaps. But then we come back to the problem of trying to generalize to a different climate. So, I definitely think there are different parts of the climate system that are more amenable to the machine learning approach than others.
Også, some aspects of climate model simulations are already very good. Models are already doing well in simulating the large scale fluid dynamics of the atmosphere, for eksempel. So those parts of climate models are very unlikely to be replaced with machine learning approaches that would be less flexible than a purely physics-based approach.
Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.