Videnskab
 science >> Videnskab >  >> Natur

Maskinlæring identificerer forbindelser mellem verdenshavene

En repræsentation af det globale hav samlet af lignende karakteristika. Kredit:Maike Sonnewald

Oceanografer, der studerer det globale oceans fysik, har længe stået over for en gåde:Væskedynamiske balancer kan variere meget fra punkt til punkt, gør det vanskeligt at foretage globale generaliseringer.

Faktorer som vinden, lokal topografi, og meteorologiske udvekslinger gør det vanskeligt at sammenligne et område med et andet. For at øge kompleksiteten, man ville skulle analysere milliarder af datapunkter for adskillige parametre - temperatur, saltholdighed, hastighed, hvordan tingene ændrer sig med dybden, om der er en tendens til stede - for at udpege, hvilken fysik der er mest dominerende i en given region.

"Du ville være nødt til at se på et overvældende antal forskellige globale kort og mentalt matche dem for at finde ud af, hvad der betyder mest, hvor, siger Maike Sonnewald, en postdoc, der arbejder i MIT Department of Earth, Atmosfæriske og planetariske videnskaber (EAPS) og medlem af EAPS-programmet i atmosfærer, Oceaner og klima (PAOC). "Det er ud over, hvad ethvert menneske kan tyde."

Sonnewald, som har en baggrund i fysisk oceanografi og datavidenskab, bruger computere til at afsløre forbindelser og mønstre i havet, som ellers ville være uden for menneskets evner. For nylig, hun anvendte en maskinlæringsalgoritme, der sigtede gennem enorme mængder data for at identificere mønstre i havet, der har lignende fysik, viser, at der er fem globale dynamisk konsistente regioner, der udgør det globale hav.

"Det er fantastisk, fordi det er så enkelt, " siger Sonnewald. "Det tager det virkelig komplicerede verdenshav og destillerer det ned til et par vigtige mønstre. Vi bruger disse til at udlede, hvad der foregår, og til at fremhæve områder, der er mere komplicerede."

Sonnewald og medforfatterne Carl Wunsch, EAPS professor emeritus i fysisk oceanografi og PAOC-medlem, og Patrick Heimbach, en EAPS forskningspartner og tidligere seniorforsker, nu ved University of Texas i Austin, offentliggjorde deres resultater i et særligt nummer om "Geoscience Papers of the Future" i Jord- og rumvidenskab .

For data om, hvad der sker i havet, Sonnewald brugte Estimating the Circulation and Climate of the Ocean (ECCO) statsestimat. ECCO er et 20-årigt skøn over havets klima og cirkulation baseret på milliarder af observationsdata. Sonnewald anvendte derefter en algoritme, der er almindelig inden for områder lige fra farmaceutisk til ingeniørforskning, kaldet K-betyder klyngedannelse, som giver mulighed for identifikation af robuste mønstre i data for at bestemme, hvad den dominerende fysik i havet er, og hvor de gælder.

Resultaterne viser, at der er fem klynger, der udgør 93,7 procent af det globale hav. For eksempel, i den største klynge, tegner sig for 43 procent af det globale hav, den mest dominerende fysiske egenskab er, at vindspænding på havets overflade er afbalanceret af bundmomenter. Områder, hvor dette findes:et tyndt bånd i det sydlige ocean, store områder af det arktiske hav, zonestriber i troperne, og subtropiske og subpolære gyres på den nordlige halvkugle.

De andre fire klynger beskriver på samme måde den dominerende fysiske kraft og i hvilken del af det globale hav den kan findes. Algoritmen identificerede også de resterende 6,3 procent af havet som områder, der var for komplicerede til at blive fastgjort til et simpelt sæt fysiske egenskaber. Denne opdagelse er også nyttig, siger Sonnewald, da det giver forskere fordelen ved at vide, hvor afvigende værdier gælder.

"Jeg tror, ​​at det virkelig vil lette meget af analysen og hjælpe os med at fokusere vores forskning de rigtige steder, siger Sonnewald.

Wunsch siger, at en spændende implikation af forskningen er, at den kan hjælpe oceanografi til at ligne mere geologi, idet forskere, der fokuserer på specifikke områder af havet, kan samarbejde og sammenligne noter. En videnskabsmand, der arbejder i en region, kunne sammenligne denne region med en, der opfører sig på samme måde.

"På en måde, det er en bedre måde at bruge vores værktøjer på, " siger Wunsch.

Hvad den ikke kan fortælle dig, siger Wunsch, er grunden til, at regioner opfører sig anderledes. "Det kræver stadig et menneske at gå ind og forsøge at forstå, hvad der foregår på steder, hvor maskinen identificerede at kigge, " han siger.

Som et næste skridt, Sonnewald kører den samme metode med data i højere opløsning for at fastlægge de komplicerede resterende 6,3 procent. Fokus vil være på væltning og gyrecirkulation, som begge er følsomme over for et skiftende klima.

Sonnewald håber, at disse tidlige fund giver overbevisende beviser for oceanografer til at arbejde mere med dataforskere for at afsløre flere mønstre, der er til stede i det globale hav. Inden du kom til MIT, Sonnewald modtog en mastergrad i kompleks systemsimulering ved The Institute for Complex Systems Simulation ved University of Southampton og en Ph.D. i fysisk oceanografi og simulering af komplekse systemer baseret på National Oceanography Center i Southampton, England. Siden da, hun har fokuseret på at anvende datavidenskab til fysisk oceanografi som postdoc ved MIT og Harvard University.

Begge områder har oplevet dramatiske fremskridt i de seneste årtier, siger Sonnewald. Men der er stadig et hul mellem "black box"-computerkraften i kunstig intelligens og den dybe mængde observationsdata, der gør indsatser som ECCO mulige.

"Fordi vi på en måde vejleder maskinlæringsalgoritmen ved hjælp af oceanfysik og verificerer resultaterne ved de kanoniske regimer, som vi ved burde være der, vi er i stand til at lukke det hul, " siger Sonnewald. "Det er som at bygge bro mellem maskinlæring og oceanografi, og forhåbentlig vil andre mennesker krydse den bro."

Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.




Varme artikler