Videnskab
 science >> Videnskab >  >> Astronomi

Nye værktøjer til at øge adgangen til NASAs jordvidenskabelige data

NASA har 26 jordobservationssatellitter, der overvåger de vitale tegn på vores hjemmeplanet. Sammen med luftbårne og jordvidenskabelige missioner, deres data lagres og administreres af Jordobservationssystemets data- og informationssystem. Kredit:NASA

NASA har finansieret fem nye projekter til at udvikle værktøjer og teknologi til at gøre agenturets massive geovidenskabelige datasæt mere tilgængelige og brugervenlige.

Vågn op. Tænd den bærbare computer. Begynd at behandle luftbårne data fra Adirondack-skovene i New York. Lav kaffe. Spis morgenmad. Spænd den åbne laptops sikkerhedssele i passagersædet, mens den fortsætter med at knuse tal. Køre til arbejde.

Det plejede at være Sara Lubkins morgenrutine som en tidlig karriereforsker ved NASAs Goddard Space Flight Center i Greenbelt, Maryland. En gang på arbejde, hun ville bruge sin stationære computer, mens hendes bærbare computer flittigt brugte de næste 12 timer på at behandle luftbårne instrumentdata for at få den relevante information, hun havde brug for for at studere invasive skadedyr af hemlock-træer.

Jordvisualisering

NASAs jordvidenskabelige datasæt giver forskellige perspektiver og oplysninger om vores planet, som det ses her i denne datavisualisering af observationer af orkanen Matthew i oktober 2016. Credits:NASA's Scientific Visualization Studio

"Jeg er ikke datalog, Jeg er jordforsker, " sagde Lubkin, som nu arbejder som programmedarbejder for NASA Earth Science Data Systems' Advancing Collaborative Connections for Earth Systems Science, eller ADGANG til programmet. Men hendes erfaring som forsker er ikke enestående.

At bruge store bidder af tid på blot at få jordvidenskabelige data i en brugbar form til analyse er en almindelig situation for forskere, der arbejder med de store datasæt, der kommer fra NASA-feltet, luftbårne og satellitmissioner. Downloader store filer, konvertering af dataformater, at lokalisere de samme undersøgelsesområder i flere datasæt, at skrive kode for at skelne mellem forskellige landtyper i et satellitbillede - disse typer opgaver tærer på tid, som videnskabsmænd hellere vil bruge til at analysere de faktiske oplysninger i dataene.

Det er her ACCESS-programmet kommer ind i billedet. Del af Earth Science Data Systems-divisionen siden 2005, ACCESS finder innovative måder at strømline den besværlige behandlingstid på. Programmet finansierer toårige forskningsprojekter for at forbedre datahåndteringen bag kulisserne og levere klar-til-brug datasæt og tjenester til videnskabsmænd, sagde Lubkin.

I juni, NASA udvalgte fem hold af NASA, universitets- og kommercielle datalogiforskere fra 2017-runden af ​​afleveringer i en række projekter, der vil bruge maskinlæring, cloud computing og avancerede søgefunktioner til at udvikle værktøjer til at forbedre styringen bag kulisserne for udvalgte NASA-datasæt.

NASAs jordvidenskabelige datasæt giver forskellige perspektiver og oplysninger om vores planet, som det ses her i denne datavisualisering af observationer af orkanen Matthew i oktober 2016. Kredit:NASA's Scientific Visualization Studio

"Vi investerer løbende i udvikling og evaluering af de nyeste teknologier for at forbedre videnskabelige datasystemer, " sagde Kevin Murphy, programleder for NASA's Earth Science Data Systems ved NASAs hovedkvarter i Washington. Men mere end det, de vil sikre sig, at værktøjerne og teknologien hjælper rigtige videnskabsmænd med at løse reelle problemer.

Hvert ACCESS-projekt har geovidenskaber og dataloger involveret fra start til slut, sagde Murphy. "Med ACCESS-programmet, vi prøver virkelig at forstå, for eksempel, hvordan havstrømme fungerer, men vi forsøger at gøre det nu med data, der er så store, at vi har brug for et team af eksperter, der kan arbejde sammen om at løse de store videnskabs- og big data-spørgsmål."

Projekterne vil supplere datastyring, distribution og andre tjenester leveret af Earth Observing System Data and Information System (EOSDIS), som administrerer og gemmer NASA-data indsamlet fra jordobservationssatellitter, fly- og feltkampagner. EOSDIS har 12 indbyrdes forbundne data- og arkivcentre placeret over hele USA, som er organiseret efter disciplin. I øjeblikket, disse centre er vært for 26 petabyte jorddatasæt - det er 26 millioner gigabyte, eller nok data til at bruge 52, 000 computere hver med 500 gigabyte lagerplads. Det tal forventes at vokse til 150 petabyte inden for fem år med opsendelsen af ​​nye satellitter.

"Satellitdata er big data, " sagde Jeff Walter, en af ​​ACCESS 2017 hovedefterforskerne og ledende ingeniør for Science Data Services ved Atmospheric Science Data Center ved NASAs Langley Research Center i Hampton, Virginia. "Det er meget komplekst og nogle gange svært at bruge, selv for erfarne brugere. Ud over volumen, hvilket gør det vanskeligt for brugerne at erhverve, opbevare og administrere, der er også kompleksiteten af ​​både formatet og indholdet. Brugerne skal ofte bruge meget tid på at forstå, hvordan data er organiseret, og hvad de forskellige parametre repræsenterer."

Walters projekt er et af tre, der vil bruge cloud computing til at afhjælpe download- og lagringsproblemer for brugerne. Startende med to atmosfæriske datasæt, hans team vil også udvikle en måde at konvertere satellitdataformater til dem, der kan læses af kommerciel geospatial informationssystem (GIS) software.

"Vores projekt har til formål at sænke adgangsbarrieren for et potentielt nyt brugerfællesskab, som måske finder nye måder at bruge disse data på, og som er mere fortrolige med GIS-typer af værktøjer, " sagde Walter.

De to andre cloud computing-projekter vil udvikle open source-behandlings- og analyseværktøjer, inklusive en designet til havdatasæt. Et fjerde projekt vil bruge maskinlæring til at opdage ændringer over tid i landobservationer, begyndende med påvisning af jordskred, oversvømmelser og stigninger forårsaget af vulkansk aktivitet. Det femte projekt vil udvikle en automatiseret metode til at opstille datasæt, der observerer den samme placering, så forskere kan kombinere mere end én type information om et sted.

Ved afslutningen, ACCESS-forskerne vil arbejde tæt sammen med EOSDIS-holdene for at integrere deres fremskridt i datacentrenes daglige drift. Når de nye værktøjer er på plads, det er når den virkelige kraft af åbne og frit tilgængelige geovidenskabelige datasæt kan blomstre, ifølge Murphy. Nem at bruge data betyder, at de kommer i hænderne på beslutningstagere, ikke-statslige organisationer, forskere, der studerer relaterede applikationer og forskere inden for forskellige områder, der kan have nye anvendelser for det.

"Når du gør disse produkter åbne og tilgængelige, du har en masse utilsigtede, gode videnskabelige konsekvenser, " sagde Murphy, citerer eksempler, der omfatter detektering af grundvandsbevægelser fra rummet, hurtig opdagelse af naturbrande og brug af natlys til at studere menneskets energiforbrug. "NASA har en masse meget værdifuld information, og ACCESS-programmet forsøger virkelig at hjælpe videnskabsfolk til ikke kun at tage fat på primære videnskabelige spørgsmål, men også hjælpe os med at forstå vores miljø og planlægge vores fremtid."


Varme artikler