Geovidenskabsfolk har udnyttet en teknik, der almindeligvis bruges til talegenkendelse til at opdage begivenheder, der spænder fra alpine klippeskred til vulkanske advarselsskilte, der ellers ville gå ubemærket hen. Kredit:USGS Hawaiian Volcano Observatory
Forskere, der søger at forstå Jordens indre urværk, har indsat hære af sensorer, der lytter efter tegn på glidninger, buldrer, udånder og andre forstyrrelser, der stammer fra planetens dybeste fejl til dens højeste vulkaner. "Vi måler jordens bevægelse løbende, typisk indsamling af 100 prøver i sekundet ved hundredvis til tusinder af instrumenter, "sagde Stanford -geofysiker Gregory Beroza." Det er bare en enorm flux af data. "
Alligevel har forskernes evne til at udtrække mening fra disse oplysninger ikke holdt trit.
Den faste Jord, oceanerne og atmosfæren danner tilsammen et geosystem, hvor fysiske, biologiske og kemiske processer interagerer på skalaer fra millisekunder til milliarder af år, og fra størrelsen af et enkelt atom til størrelsen på en hel planet. "Alle disse ting er koblet på et eller andet niveau, "forklarede Beroza, Wayne Loel -professoren på School of Earth, Energi- og miljøvidenskab (Stanford Earth). "Vi forstår ikke de enkelte systemer, og vi forstår ikke deres forhold til hinanden. "
Nu, som Beroza og medforfattere skitserer i et papir, der blev offentliggjort 21. marts i tidsskriftet Videnskab , maskinlæringsalgoritmer uddannet til at udforske strukturen i stadigt voksende geologiske datastrømme, bygge på observationer, mens de går og give mening om stadig mere komplekse, spredte simuleringer hjælper forskere med at besvare vedholdende spørgsmål om, hvordan Jorden fungerer.
Fra automatisering til opdagelse
"Da jeg begyndte at samarbejde med geoforskere for fem år siden, der var interesse og nysgerrighed omkring maskinlæring og datavidenskab, "mindede Karianne Bergen, hovedforfatter på papiret og en forsker ved Harvard Data Science Initiative, der fik sin doktorgrad i beregnings- og matematisk teknik fra Stanford. "Men forskergruppen, der brugte maskinlæring til geovidenskabsprogrammer, var relativt lille."
Det ændrer sig hurtigt. De mest enkle anvendelser af maskinlæring inden for jordvidenskab automatiserer gentagne opgaver som kategorisering af vulkanske askepartikler og identifikation af piggen i et sæt seismiske wiggles, der angiver starten på et jordskælv. Denne type maskinlæring ligner applikationer på andre områder, der kan træne en algoritme til at opdage kræft i medicinske billeder baseret på et sæt eksempler mærket af en læge. Mere avancerede algoritmer, der låser op for nye opdagelser inden for jordvidenskab og videre, kan begynde at genkende mønstre uden at arbejde ud fra kendte eksempler.
"Antag, at vi udvikler en jordskælvsdetektor baseret på kendte jordskælv. Det vil finde jordskælv, der ligner kendte jordskælv, "Beroza forklarede." Det ville være meget mere spændende at finde jordskælv, der ikke ligner kendte jordskælv. "Beroza og kolleger på Stanford har været i stand til at gøre netop det ved at bruge en algoritme, der markerer enhver gentagende signatur i sætene med wiggles hentet af seismografer - de instrumenter, der registrerer rystelser fra jordskælv - frem for kun at jage efter de mønstre, der er skabt af jordskælv, som forskere tidligere har katalogiseret.
Geofysikeren Gregory Beroza er blandt et stigende antal forskere, der træner maskinlæringsalgoritmer til at give mening om stadig mere komplekse simuleringer af Jordens geosystemer. Kredit:Stacy Geiken
Begge typer algoritmer - dem med eksplicit mærkning i træningsdataene og dem uden - kan opbygges som dybe neurale netværk, som fungerer som et system med mange lag, hvor resultaterne af en vis transformation af data i et lag fungerer som input til en ny beregning i det næste lag. Blandt andre bestræbelser noteret i avisen, disse typer netværk har gjort det muligt for geoforskere hurtigt at beregne hastigheden af seismiske bølger - en kritisk beregning til estimering af jordskælvs ankomsttider - og at skelne mellem rystelser forårsaget af Jordens naturlige bevægelse i modsætning til eksplosioner.
En ufuldkommen efterligning
Udover at få øje på overset mønstre, maskinlæring kan også hjælpe med at tæmme overvældende datasæt. Modellerer hvordan et jordskælv påvirker den viskøse del af laget i Jordens indre, der strækker sig hundredvis af miles under planetens yderste skorpe, for eksempel, kræver en uoverstigelig stor mængde computerkraft. Men maskinlæringsalgoritmer kan finde genveje, hovedsageligt efterligne løsninger til mere detaljerede ligninger med mindre computing.
"Vi kan få en temmelig god tilnærmelse til virkeligheden, som vi vil kunne anvende på datasæt, der er så store eller simuleringer, der er så omfattende, at de mest kraftfulde computere, der er tilgængelige, ikke ville kunne behandle dem, "Sagde Beroza.
Hvad mere er, eventuelle mangler i præcisionen i kunstig intelligens-baserede løsninger på disse ligninger blegner ofte i betydning sammenlignet med indflydelsen fra forskernes egne beslutninger om, hvordan de skal opstille beregninger i første omgang. "Vores største fejlkilde kommer ikke af vores manglende evne til at løse ligningerne, "Beroza sagde." Det kommer fra at vide, hvordan Jordens indre struktur egentlig er og de parametre, der skal gå ind i disse ligninger. "
Åben videnskab
At være sikker, maskinlæring er langt fra et perfekt værktøj til at besvare de mest tornede spørgsmål inden for jordvidenskab. "De mest kraftfulde maskinlæringsalgoritmer kræver typisk store mærkede datasæt, som ikke er tilgængelige for mange geovidenskabsprogrammer, "Sagde Bergen. Hvis forskere træner en algoritme om utilstrækkelige eller forkert mærkede data, advarede hun, det kan få modeller til at gengive bias, der ikke nødvendigvis afspejler virkeligheden.
Denne type fejl kan delvis bekæmpes gennem større gennemsigtighed og oprettelse af "benchmark" datasæt, som forskerne hævder kan anspore konkurrence og give mulighed for æbler-til-æbler sammenligninger af algoritme ydeevne. Ifølge Bergen, "Vedtagelse af åbne videnskabsprincipper, herunder deling af data og kode, vil bidrage til at fremskynde forskningen og også give samfundet mulighed for at identificere og håndtere begrænsninger eller svagheder ved foreslåede tilgange. "
Menneskelig utålmodighed kan være sværere at holde i skak. "Det, jeg er bekymret for, er, at folk vil bruge AI naivt, "Sagde Beroza." Du kan forestille dig nogen, der træner et flerlags, dybt neuralt netværk til at forudsige jordskælv - og derefter ikke teste metoden på en måde, der korrekt validerer dens forudsigelsesværdi. "