Videnskab
 science >> Videnskab >  >> Astronomi

Computer søger teleskopdata for beviser på fjerne planeter

En ung sollignende stjerne omkranset af sin planetdannende skive af gas og støv. Kredit:NASA/JPL-Caltech

Som en del af et forsøg på at identificere fjerne planeter, der er gæstfrie over for liv, NASA har etableret et crowdsourcing-projekt, hvor frivillige søger teleskopbilleder efter bevis på affaldsskiver omkring stjerner, som er gode indikatorer for exoplaneter.

Ved at bruge resultaterne af dette projekt, forskere ved MIT har nu trænet et maskinlæringssystem til selv at søge efter affaldsdiske. Omfanget af søgningen kræver automatisering:Der er næsten 750 millioner mulige lyskilder i de data, der er akkumuleret gennem NASA's Wide-Field Infrared Survey Explorer (WISE) mission alene.

I test, maskinlæringssystemet stemte overens med menneskelig identifikation af affaldsskiver 97 procent af tiden. Forskerne trænede også deres system til at vurdere affaldsskiver efter deres sandsynlighed for at indeholde sporbare exoplaneter. I et papir, der beskriver det nye arbejde i journalen Astronomi og databehandling , MIT-forskerne rapporterer, at deres system identificerede 367 tidligere uundersøgte himmellegemer som særligt lovende kandidater til yderligere undersøgelse.

Værket repræsenterer en usædvanlig tilgang til maskinlæring, som er blevet forkæmpet af en af ​​avisens medforfattere, Victor Pankratius, en hovedforsker ved MIT's Haystack Observatory. Typisk, et maskinlæringssystem vil gennemsøge et væld af træningsdata, leder efter konsistente sammenhænge mellem funktionerne i dataene og en etiket anvendt af en menneskelig analytiker - i dette tilfælde, stjerner omkranset af affaldsskiver.

Men Pankratius hævder, at i videnskaberne, maskinlæringssystemer ville være mere nyttige, hvis de eksplicit inkorporerede en lille smule videnskabelig forståelse, at hjælpe med at guide deres søgninger efter sammenhænge eller identificere afvigelser fra normen, der kunne være af videnskabelig interesse.

"Hovedvisionen er at gå ud over, hvad A.I. fokuserer på i dag, " siger Pankratius. "I dag, vi indsamler data, og vi forsøger at finde funktioner i dataene. Du ender med milliarder og atter milliarder af funktioner. Så hvad laver du med dem? Det, du vil vide som videnskabsmand, er ikke, at computeren fortæller dig, at bestemte pixels er bestemte funktioner. Du vil gerne vide 'Åh, dette er en fysisk relevant ting, og her er de fysiske parametre for tingen.'"

Klasseværelsesopfattelse

Det nye papir voksede ud af et MIT-seminar, som Pankratius underviste sammen med Sara Seager, klassen af ​​1941 professor i jord, Atmosfærisk, og planetariske videnskaber, som er kendt for sin exoplanetforskning. Seminaret, Astroinformatik for exoplaneter, introducerede eleverne til datavidenskabsteknikker, der kunne være nyttige til at fortolke den strøm af data, der genereres af nye astronomiske instrumenter. Efter at have mestret teknikkerne, eleverne blev bedt om at anvende dem på udestående astronomiske spørgsmål.

Til hendes afsluttende projekt, Tam Nguyen, en kandidatstuderende i luftfart og astronautik, valgte problemet med at træne et maskinlæringssystem til at identificere affaldsskiver, og det nye papir er en udløber af det arbejde. Nguyen er første forfatter på papiret, og hun får selskab af Seager, Pankratius, og Laura Eckman, en bachelor med speciale i elektroteknik og datalogi.

Fra NASA crowdsourcing-projektet, forskerne havde de himmelske koordinater for de lyskilder, som menneskelige frivillige havde identificeret som med affaldsskiver. Skiverne kan genkendes som lysellipser med lidt lysere ellipser i deres centre. Forskerne brugte også de rå astronomiske data genereret af WISE-missionen.

For at forberede dataene til maskinlæringssystemet, Nguyen skåret det op i små bidder, brugte derefter standard signalbehandlingsteknikker til at bortfiltrere artefakter forårsaget af billedinstrumenterne eller af omgivende lys. Næste, hun identificerede de bidder med lyskilder i deres centre, og brugte eksisterende billedsegmenteringsalgoritmer til at fjerne eventuelle yderligere lyskilder. Disse typer procedurer er typiske i ethvert computer-vision maskinlæringsprojekt.

Kodede intuitioner

Men Nguyen brugte grundlæggende fysikprincipper til at beskære dataene yderligere. For én ting, hun så på variationen i intensiteten af ​​det lys, der udsendes af lyskilderne over fire forskellige frekvensbånd. Hun brugte også standardmålinger til at evaluere stillingen, symmetri, og lyskildernes skala, fastsættelse af tærskler for optagelse i hendes datasæt.

Ud over de mærkede affaldsdiske fra NASAs crowdsourcing-projekt, forskerne havde også en kort liste over stjerner, som astronomer havde identificeret som sandsynligvis vært for exoplaneter. Ud fra den information, deres system udledte også karakteristika af affaldsskiver, der var korreleret med tilstedeværelsen af ​​exoplaneter, at udvælge de 367 kandidater til videre studier.

"I betragtning af skalerbarhedsudfordringerne med big data, at udnytte crowdsourcing og borgervidenskab til at udvikle træningsdatasæt til maskinlæringsklassifikatorer til astronomiske observationer og tilknyttede objekter er en innovativ måde at løse udfordringer ikke kun inden for astronomi, men også flere forskellige dataintensive videnskabsområder, " siger Dan Crichton, der leder Center for Datavidenskab og Teknologi ved NAASAs Jet Propulsion Laboratory. "Brugen af ​​den beskrevne computerstøttede opdagelsespipeline til at automatisere udvindingen, klassifikation, og valideringsprocessen vil være nyttig til at systematisere, hvordan disse kapaciteter kan bringes sammen. Papiret gør et godt stykke arbejde med at diskutere effektiviteten af ​​denne tilgang, som den anvendes på affaldsdiskkandidater. Erfaringerne bliver vigtige for at generalisere teknikkerne til andre astronomi og forskellige discipliner."

"Disk Detective videnskabsteam har arbejdet på sit eget maskinlæringsprojekt, og nu hvor dette blad er ude, vi bliver nødt til at tage os sammen og sammenligne noter, " siger Marc Kuchner, en senior astrofysiker ved NASAs Goddard Space Flight Center og leder af crowdsourcing-diskdetektionsprojektet kendt som Disk Detective. "Jeg er virkelig glad for, at Nguyen kigger på dette, for jeg tror virkelig, at denne form for maskine-menneske-samarbejde vil være afgørende for at analysere fremtidens store datasæt."

Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.




Varme artikler