Videnskab
 science >> Videnskab >  >> Astronomi

SpaceML.org:En ny ressource til at accelerere AI-anvendelse inden for rumvidenskab og -udforskning

Da SpaceML fortsætter med at vokse, vil det hjælpe med at bygge bro mellem datalagring, kodedeling og serverside (cloud) analyse. Kredit:FDL/SETI Instituttet

SETI Institute og Frontier Development Lab (FDL.ai) annoncerer lanceringen af ​​SpaceML.org. SpaceML er en ressource, der gør AI-klare datasæt tilgængelige for forskere, der arbejder inden for rumvidenskab og -udforskning, muliggør hurtig eksperimentering og reproducerbarhed.

SpaceML Repo er en maskinlæringsværktøjskasse og fællesskabsstyret ressource, der gør det muligt for forskere mere effektivt at engagere sig i AI til rumvidenskab og -udforskning. Det er designet til at hjælpe med at bygge bro mellem datalagring, kodedeling og server-side (cloud) analyse.

SpaceML.org inkluderer analyseklare datasæt, rumvidenskabelige projekter og MLOPS-værktøjer designet til at fremskynde eksisterende AI-arbejdsgange til nye use-cases. Datasættene og projekterne bygger på fem års banebrydende AI-applikation færdiggjort af FDL-teams af tidlige karriere-ph.d.'er i AI/ML og multidisciplinære videnskabsdomæner i samarbejde med NASA, ESA og FDLs kommercielle partnere. Udfordringsområder omfatter geovidenskab, måneudforskning, astrobiologi, planetarisk forsvar, udforskningsmedicin, katastrofeberedskab, heliofysik og rumvejr.

"De mest virkningsfulde og nyttige anvendelser af kunstig intelligens og maskinlæringsteknikker kræver datasæt, der er blevet ordentligt forberedt, organiseret og struktureret til sådanne tilgange, " sagde Bill Diamond, CEO for SETI Institute. "Fem års FDL-forskning på tværs af en bred vifte af videnskabelige domæner har muliggjort etableringen af ​​en række analyseklare datasæt, som vi er glade for nu at gøre tilgængelige for det bredere forskningssamfund."

FDL anvender AI og machine learning (ML) teknologier til videnskaben for at skubbe grænserne for forskning og udvikle nye værktøjer til at hjælpe med at løse nogle af menneskehedens største udfordringer, både her på jorden og i rummet.

Projekter hostet på SpaceML.org for forskningssamfundet omfatter:

  • Et projekt, der tackler problemet med, hvordan man bruger ML til at autokalibrere rumbaserede instrumenter, der bruges til at observere Solen. Efter mange års eksponering for vores stjerne, disse instrumenter nedbrydes over tid - lidt ligesom grå stær. Omkalibrering kræver dyre raketter, der sonderer. Ved at bruge ML, holdet har været i stand til at udvide dataene, faktisk "fjerner" grå stær.

    "Hurdringen for mange forskere for at begynde at bruge SDOML-datasættet, og begynde at udvikle ML-løsninger, er den friktion, de oplever ved første start, " sagde Mark Cheung, Sr. personalefysiker hos Lockheed Martin og hovedefterforsker for NASA Solar Dynamics Observatory/Atmospheric Imaging Assembly. "SpaceML giver dem en jumpstart ved at reducere den indsats, der kræves til udforskende dataanalyse og modelimplementering. Det demonstrerer også reproducerbarhed i aktion."

  • Et andet projekt demonstrerer, hvordan datareduktionen af ​​et meteorovervågningsnetværk kendt som CAMS (Cameras for Allsky Meteor Surveillance) kunne automatiseres for at identificere nye meteorregn-klynger - potentielt sporene fra oldtidens Jord, der krydser kometer. Siden AI-rørledningen er blevet sat på plads er i alt ni nye meteorregn blevet opdaget via CAMS.

    "SpaceML hjalp med at accelerere indvirkningen ved at bringe et team af borgerforskere ind, som implementerede en fortolkelig Active Learning og AI-drevet meteorklassifikator til at automatisere indsigt, tillader astronomerne fokuseret forskning til SETI CAMS-projektet, " sagde Siddha Ganju, Selvkørende og medicinske instrumenter AI-arkitekt, Nvidia (grundlægger af SpaceML's CAMS og Worldview Search Initiatives). "Under SpaceML standardiserede vi (1) behandlingspipelinen til at behandle det årti lange meteordatasæt indsamlet af CAMS, og, etableret den nyeste meteorklassificering med en unik forstærkningsstrategi; (2) aktiveret aktiv læring i CAMS-pipelinen for at automatisere indsigt; og, (3) opdaterede NASA CAMS Meteor Shower Portal, som nu inkluderer himmelske referencepunkter og et videnskabeligt kommunikationsværktøj. Og det bedste er, at fremtidige borgerforskere kan deltage i CAMS-projektet ved at bygge videre på de offentligt tilgængelige trænede modeller, scripts, og webværktøjer."

    SpaceML er også vært for INARA (Intelligent ExoplanET Atmospheric RetrievAI), en pipeline til atmosfærisk genfinding baseret på et syntetiseret datasæt med tre millioner planetariske spektre, at opdage beviser for mulig biologisk aktivitet i exoplanetatmosfærer – med andre ord, "Er vi alene?"

    SpaceML.org søger at samle et centralt lager af projektnotesbøger og datasæt genereret fra projekter, der ligner dem, der er anført ovenfor. Disse projektlagre indeholder en Google "Co-Lab"-notesbog, der leder brugerne gennem datasættet og inkluderer et lille datauddrag til en hurtig testkørsel, før den forpligter sig til hele datasættet (som uvægerligt er meget stort).

    Projekterne rummer også det komplette datasæt, der bruges til udfordringerne, som kan stilles til rådighed efter anmodning. Derudover SpaceML søger at lette håndteringen af ​​nye datasæt, der er resultatet af igangværende forskning og med tiden afvikle turneringer for at invitere til forbedringer af ML-modeller (og data) i forhold til kendte benchmarks.

    "Vi var bekymrede for, hvordan vi kan gøre vores AI-forskning mere reproducerbar, " sagde James Parr, FDL direktør og administrerende direktør, Trillium teknologier. "Vi indså, at den bedste måde at gøre dette på var at gøre dataene let tilgængelige, men også at vi var nødt til at forenkle både onboarding-processen, indledende eksperimenter og workflowtilpasningsproces."

    "Problemet med AI-reproducerbarhed er ikke nødvendigvis, 'ikke opfundet her' - det er mere, "ikke nok tid til at prøve." Vi tænkte på, om vi kunne dele analyseklare data, muliggør hurtig eksperimentering på serversiden og god versionskontrol, det ville være den bedste ting at hjælpe med at få disse værktøjer til at blive samlet op af samfundet til gavn for alle."

    FDL lancerer sit 2021-program den 16. juni, 2021, med forskere i USA, der adresserer syv udfordringer inden for heliofysik, Astronaut sundhed, Planetvidenskab og geovidenskab. Programmet kulminerer i midten af ​​august, med teams, der viser deres arbejde i en virtuel begivenhed.


Varme artikler