De avancerede jordvidenskabelige satellitter, der opsendes i den nærmeste fremtid, vil generere hidtil usete mængder af data om vores planets vitale tegn. Cloud computing vil hjælpe forskere med at få mest muligt ud af disse mængder af information. Kredit:NASA Earth Observatory
Efterhånden som satellitter indsamler større og større mængder data, ingeniører og forskere implementerer løsninger til at håndtere disse enorme stigninger.
De banebrydende jordvidenskabelige satellitter, der opsendes i de næste par år, vil give mere detaljerede visninger af vores planet end nogensinde før. Vi vil være i stand til at spore havtræk i lille skala som kyststrømme, der flytter næringsstoffer, der er afgørende for marine fødevæv, overvåge, hvor meget ferskvand der strømmer gennem søer og floder, og pletbevægelse i Jordens overflade på mindre end en halv tomme (en centimeter). Men disse satellitter vil også producere en syndflod af data, der får ingeniører og videnskabsmænd til at opsætte systemer i skyen, der er i stand til at behandle, opbevaring, og analysere al den digitale information.
"For omkring fem eller seks år siden, der var en erkendelse af, at fremtidige jordmissioner ville generere en enorm mængde data, og at de systemer, vi brugte, ville blive utilstrækkelige meget hurtigt, " sagde Suresh Vannan, leder af Physical Oceanography Distributed Active Archive Center baseret på NASAs Jet Propulsion Laboratory i det sydlige Californien.
Centret er et af flere under NASA's Earth Science Data Systems-program, der er ansvarlig for behandling, arkivering, dokumentere, og distribuere data fra agenturets jordobservationssatellitter og feltprojekter. Programmet har i flere år arbejdet på en løsning på udfordringen med informationsvolumen ved at flytte dets data- og datahåndteringssystemer fra lokale servere til skyen – software og computertjenester, der kører på internettet i stedet for lokalt på en andens maskine.
En del af SWOT-satellittens videnskabsinstruments nyttelast sidder i et rent rum på NASAs Jet Propulsion Laboratory under montering. Ved at måle højden af vandet i planetens hav, søer, og floder, forskere kan spore mængden og placeringen af den endelige ressource rundt om i verden. Kredit:NASA/JPL-Caltech
Sentinel-6 Michael Freilich satellitten, del af den amerikansk-europæiske Sentinel-6/Jason-CS (Continuity of Service) mission, er den første NASA-satellit til at bruge dette skysystem, selvom mængden af data, som rumfartøjet sender tilbage, ikke er så stor som de data, mange fremtidige satellitter vil returnere.
To af de kommende missioner, SWOT og NISAR, vil tilsammen producere omkring 100 terabyte data om dagen. En terabyte er omkring 1, 000 gigabyte – nok digital lagerplads til cirka 250 spillefilm. SWOT, forkortelse for Surface Water and Ocean Topography, vil producere omkring 20 terabyte videnskabelige data om dagen, mens NISAR-missionen (NASA-Indian Space Research Organization Synthetic Aperture Radar) vil generere omkring 80 terabyte dagligt. Data fra SWOT vil blive arkiveret med Physical Oceanography Distributed Active Archive Center, mens data fra NISAR vil blive håndteret af Alaska Satellite Facility Distributed Active Archive Center. NASAs nuværende geovidenskabelige dataarkiv er omkring 40 petabyes (1 petabyte er 1, 000 terabyte), men i 2025 – et par år efter SWOT og NISAR er lanceret – forventes arkivet at rumme mere end 245 petabyte data.
Både NISAR og SWOT vil bruge radarbaserede instrumenter til at indsamle information. Målet er en lancering i 2023, NISAR vil overvåge planetens overflade, indsamling af data om miljøkarakteristika, herunder skift i jorden i forbindelse med jordskælv og vulkanudbrud, ændringer i Jordens iskapper og gletsjere, og udsving i landbrugsaktiviteter, vådområder, og skovenes størrelse.
En del af NISAR-satellitten hviler i et termisk vakuumkammer på NASAs Jet Propulsion Laboratory i august 2020. Jordsatellitten vil spore subtile ændringer i planetens overflade så små som 0,4 tommer. Kredit:NASA/JPL-Caltech
Indstillet til en lancering i 2022, SWOT vil overvåge højden af planetens overfladevand, både hav og ferskvand, og vil hjælpe forskere med at udarbejde den første undersøgelse af verdens ferskvand og småskala havstrømme. SWOT udvikles i fællesskab af NASA og det franske rumagentur Centre National d'Etudes Spatial.
"Dette er en ny æra for jordobservationsmissioner, og den enorme mængde data, de vil generere, kræver en ny æra for datahåndtering, " sagde Kevin Murphy, chief science data officer for NASA's Science Mission Directorate. "NASA arbejder ikke kun på tværs af agenturet for at lette effektiv adgang til en fælles cloud-infrastruktur, vi træner også videnskabssamfundet i at få adgang til analysere, og bruge disse data."
Hurtigere downloads
I øjeblikket, Jordvidenskabelige satellitter sender data tilbage til jordstationer, hvor ingeniører omdanner den rå information fra etaller og nuller til målinger, som folk kan bruge og forstå. Behandling af rådata øger filstørrelsen, men for ældre missioner, der sender relativt mindre mængder information tilbage, dette er ikke et stort problem. Målingerne sendes derefter til et dataarkiv, der opbevarer informationen på servere. Generelt, når en forsker ønsker at bruge et datasæt, de logger på en hjemmeside, downloade de data, de ønsker, og derefter arbejde med det på deres maskine.
Imidlertid, med missioner som SWOT og NISAR, det vil ikke være muligt for de fleste videnskabsmænd. Hvis nogen ville downloade en dags information fra SWOT til deres computer, de skal bruge 20 bærbare computere, hver i stand til at lagre en terabyte data. Hvis en forsker ville downloade fire dages data fra NISAR, det ville tage omkring et år at udføre på en gennemsnitlig internetforbindelse i hjemmet. At arbejde med data, der er gemt i skyen, betyder, at videnskabsmænd ikke behøver at købe store harddiske for at downloade dataene eller vente måneder, da adskillige store filer downloades til deres system. "Behandling og lagring af store mængder data i skyen vil muliggøre en omkostningseffektiv, effektiv tilgang til undersøgelse af big-data-problemer, " sagde Lee-Lueng Fu, JPL-projektforsker for SWOT.
Infrastrukturbegrænsninger vil ikke være så meget bekymrende, enten, da organisationer ikke skal betale for at gemme forbløffende mængder af data eller vedligeholde den fysiske plads til alle disse harddiske. "Vi har bare ikke den ekstra fysiske serverplads hos JPL med tilstrækkelig kapacitet og fleksibilitet til at understøtte både NISAR og SWOT, " sagde Hook Hua, en JPL videnskabsdatasystemarkitekt til begge missioner.
NASA-ingeniører har allerede draget fordel af dette aspekt af cloud computing til et proof-of-concept-produkt ved hjælp af data fra Sentinel-1. Satellitten er en ESA-mission (European Space Agency), der også ser på ændringer i Jordens overflade, selvom den bruger en anden type radarinstrument end dem NISAR vil bruge. Arbejde med Sentinel-1-data i skyen, ingeniører producerede et farvelagt kort, der viser ændringen i Jordens overflade fra mere vegeterede områder til ørkener. "Det tog en uge med konstant databehandling i skyen, ved at bruge det svarende til tusindvis af maskiner, sagde Paul Rosen, JPL-projektforsker for NISAR. "Hvis du prøvede at gøre dette uden for skyen, du skulle have købt alle de tusindvis af maskiner."
Cloud computing vil ikke erstatte alle de måder, hvorpå forskere arbejder med videnskabelige datasæt, men i det mindste for geovidenskab, det vinder helt sikkert frem, sagde Alex Gardner, et NISAR videnskabsteammedlem ved JPL, der studerer gletsjere og havniveaustigning. Han forestiller sig, at de fleste af hans analyser vil ske andre steder i den nærmeste fremtid i stedet for på hans bærbare eller personlige server. "Jeg forventer fuldt ud om fem til 10 år, Jeg vil ikke have meget af en harddisk på min computer, og jeg vil udforske den nye brandslange af data i skyen, " han sagde.