Stadig fra en simulering af individuelle galakser, der dannes, startende på et tidspunkt, hvor universet kun var et par millioner år gammelt. Kredit:Hopkins Research Group, Caltech
Astronomer kan gå hele deres karriere uden at finde et nyt objekt på himlen. Men for Lina Necib, en postdoc i teoretisk fysik ved Caltech, opdagelsen af en klynge stjerner i Mælkevejen, men ikke født af Mælkevejen, kom tidligt - med lidt hjælp fra supercomputere, Gaia rumobservatoriet, og nye deep learning metoder.
Skriver ind Natur astronomi denne uge, Necib og hendes samarbejdspartnere beskriver Nyx, en stor ny stjernestrøm i nærheden af Solen, det kan give den første indikation af, at en dværggalakse var smeltet sammen med Mælkevejsskiven. Disse stjernestrømme menes at være kuglehobe eller dværggalakser, der er blevet strakt ud langs dens kredsløb af tidevandskræfter, før de er blevet fuldstændig forstyrret.
Opdagelsen af Nyx tog en omslynget rute, men en, der afspejler den mangefacetterede måde, astronomi og astrofysik studeres på i dag.
ILD i Kosmos
Necib studerer kinematik - eller bevægelser - af stjerner og mørkt stof i Mælkevejen. "Hvis der er nogle klumper af stjerner, der bevæger sig sammen på en bestemt måde, som normalt fortæller os, at der er en grund til, at de flytter sammen."
Siden 2014 har forskere fra Caltech, Northwestern University, UC San Diego og UC Berkeley, blandt andre institutioner, har udviklet meget detaljerede simuleringer af realistiske galakser som en del af et projekt kaldet FIRE (Feedback In Realistic Environments). Disse simuleringer inkluderer alt, hvad forskerne ved om, hvordan galakser dannes og udvikler sig. Startende fra den virtuelle ækvivalent til tidens begyndelse, simuleringerne producerer galakser, der ligner og fungerer meget som vores egen.
Kortlægning af Mælkevejen
Sideløbende med FIRE-projektet, Gaia-rumobservatoriet blev opsendt i 2013 af European Space Agency. Dens mål er at skabe et ekstraordinært præcist tredimensionelt kort over omkring en milliard stjerner i hele Mælkevejsgalaksen og videre.
"Det er den største kinematiske undersøgelse til dato. Observatoriet giver bevægelserne af en milliard stjerner, " forklarede hun. "En delmængde af det, syv millioner stjerner, har 3D hastigheder, hvilket betyder, at vi kan vide præcis, hvor en stjerne er og dens bevægelse. Vi er gået fra meget små datasæt til at lave massive analyser, som vi ikke kunne lave før for at forstå strukturen af Mælkevejen."
Opdagelsen af Nyx involverede at kombinere disse to store astrofysiske projekter og analysere dem ved hjælp af deep learning-metoder.
Blandt de spørgsmål, som både simuleringerne og himmelundersøgelsen tager fat på, er:Hvordan blev Mælkevejen til, hvad den er i dag?
"Galakser dannes ved at sluge andre galakser, " sagde Necib. "Vi har antaget, at Mælkevejen havde en stille fusionshistorie, og i et stykke tid handlede det om, hvor stille det var, fordi vores simuleringer viser en masse fusioner. Nu, med adgang til en masse mindre strukturer, vi forstår, at det ikke var så stille, som det så ud til. Det er meget kraftfuldt at have alle disse værktøjer, data og simuleringer. Alle skal bruges på én gang for at løse dette problem. Vi er på begyndelsesstadiet af virkelig at kunne forstå dannelsen af Mælkevejen."
Anvendelse af dyb læring til Gaia
Et kort over en milliard stjerner er en blandet velsignelse:så meget information, men næsten umuligt at analysere ved menneskelig opfattelse.
"Før, astronomer var nødt til at kigge og plotte meget, og måske bruge nogle klyngealgoritmer. Men det er ikke rigtig muligt længere, " sagde Necib. "Vi kan ikke stirre på syv millioner stjerner og finde ud af, hvad de laver. Det, vi gjorde i denne serie af projekter, var at bruge Gaia-mock-katalogerne."
Gaia mock-kataloget, udviklet af Robyn Sanderson (University of Pennsylvania), i det væsentlige spurgt:'Hvis FIRE-simuleringerne var ægte og observeret med Gaia, hvad skulle vi se?'
Necibs samarbejdspartner, Bryan Ostdiek (tidligere ved University of Oregon, og nu på Harvard University), som tidligere havde været involveret i Large Hadron Collider (LHC)-projektet, havde erfaring med at håndtere enorme datasæt ved hjælp af maskine og deep learning. At overføre disse metoder til astrofysik åbnede døren til en ny måde at udforske kosmos på.
"På LHC, vi har utrolige simuleringer, men vi er bekymrede for, at maskiner trænet på dem kan lære simuleringen og ikke rigtig fysik, " sagde Ostdiek. "På samme måde, FIRE-galakserne giver et vidunderligt miljø til at træne vores modeller, men de er ikke Mælkevejen. Vi skulle ikke kun lære, hvad der kunne hjælpe os med at identificere de interessante stjerner i simulering, men også hvordan man får dette til at generalisere til vores rigtige galakse."
Holdet udviklede en metode til at spore hver stjernes bevægelser i de virtuelle galakser og mærke stjernerne som enten født i værtsgalaksen eller opbygget som produkter af galaksefusioner. De to typer stjerner har forskellige signaturer, selvom forskellene ofte er subtile. Disse etiketter blev brugt til at træne deep learning-modellen, som derefter blev testet på andre FIRE-simuleringer.
Efter at de havde bygget kataloget, de anvendte det på Gaia-dataene. "Vi spurgte det neurale netværk, 'Baseret på hvad du har lært, kan du mærke, om stjernerne blev optaget eller ej?'" sagde Necib.
Modellen rangerede, hvor sikker den var, at en stjerne blev født uden for Mælkevejen i et område fra 0 til 1. Holdet lavede en cutoff med en tolerance for fejl og begyndte at udforske resultaterne.
Denne tilgang med at anvende en model, der er trænet på ét datasæt og anvende den på et andet, men relateret, kaldes transfer learning og kan være fyldt med udfordringer. "Vi skulle sikre os, at vi ikke lærer kunstige ting om simuleringen, men hvad sker der egentlig i dataene, " sagde Necib. "For det, vi var nødt til at give den en lille smule hjælp og bede den om at veje visse kendte elementer for at give den lidt af et anker."
De tjekkede først for at se, om det kunne identificere kendte træk ved galaksen. Disse omfatter "Gaia-pølsen" - resterne af en dværggalakse, der smeltede sammen med Mælkevejen for omkring seks til ti milliarder år siden, og som har en karakteristisk pølse-lignende kredsløbsform.
"Det har en meget specifik signatur, " forklarede hun. "Hvis det neurale netværk fungerede, som det skulle, vi burde se denne enorme struktur, som vi allerede ved er der."
Gaia-pølsen var der, ligesom stjerneglorien – baggrundsstjerner, der giver Mælkevejen sin afslørende form – og Helmi-strømmen, en anden kendt dværggalakse, der fusionerede med Mælkevejen i en fjern fortid og blev opdaget i 1999.
Første observation:Nyx
Modellen identificerede en anden struktur i analysen:en klynge på 250 stjerner, roterer med Mælkevejens skive, men også på vej mod centrum af galaksen.
"Dit første instinkt er, at du har en fejl, Necib fortalte. "Og du er ligesom, 'Åh nej!' Så, Jeg fortalte det ikke til nogen af mine samarbejdspartnere i tre uger. Så begyndte jeg at indse, at det ikke er en fejl, det er faktisk ægte, og det er nyt."
Men hvad nu hvis det allerede var blevet opdaget? "Du begynder at gennemgå litteraturen, at sikre, at ingen har set det, og heldigvis for mig, ingen havde. Så jeg bliver nødt til at navngive det, hvilket er det mest spændende i astrofysikken. Jeg kaldte det Nyx, nattens græske gudinde. Denne særlige struktur er meget interessant, fordi det ville have været meget svært at se uden maskinlæring."
Projektet krævede avanceret databehandling på mange forskellige stadier. FIRE og opdaterede FIRE-2 simuleringer er blandt de største computermodeller af galakser, der nogensinde er forsøgt. Hver af de ni hovedsimuleringer - tre separate galakseformationer, hver med lidt forskelligt udgangspunkt for solen - tog måneder at beregne den største, hurtigste supercomputere i verden. Disse omfattede Blue Waters ved National Center for Supercomputing Applications (NCSA), NASA's high-end computerfaciliteter, og senest Stampede2 ved Texas Advanced Computing Center (TAC).
Forskerne brugte klynger ved University of Oregon til at træne den dybe læringsmodel og til at anvende den på det massive Gaia-datasæt. De bruger i øjeblikket Frontera, det hurtigste system på ethvert universitet i verden, at fortsætte arbejdet.
"Alt ved dette projekt er beregningsmæssigt meget intensivt og ville ikke være i stand til at ske uden storskala databehandling, " sagde Necib.
Fremtidige skridt
Necib og hendes team planlægger at udforske Nyx yderligere ved hjælp af jordbaserede teleskoper. Dette vil give information om strømmens kemiske sammensætning, og andre detaljer, der vil hjælpe dem med at datere Nyx' ankomst til Mælkevejen, og muligvis give fingerpeg om, hvor det kom fra.
Den næste dataudgivelse af Gaia i 2021 vil indeholde yderligere oplysninger om 100 millioner stjerner i kataloget, gør flere opdagelser af ophobede klynger sandsynlige.
"Da Gaia-missionen startede, astronomer vidste, at det var et af de største datasæt, de ville få, med meget at glæde sig over, " sagde Necib. "Men vi var nødt til at udvikle vores teknikker for at tilpasse os datasættet. Hvis vi ikke ændrede eller opdaterede vores metoder, vi ville gå glip af fysik, der er i vores datasæt."
Succeserne med Caltech-teamets tilgang kan have en endnu større indflydelse. "Vi er ved at udvikle beregningsværktøjer, der vil være tilgængelige for mange forskningsområder og til ikke-forskningsrelaterede ting, også, " sagde hun. "Det er sådan, vi skubber den teknologiske grænse generelt."