Denne illustration afbilder lyskurver for en repræsentativ formørkelsesbinær (øverst) og et af kandidaterne til formørkelsesfiredobbelte stjernesystemer identificeret af Adam Friedman. De ekstra dyk forårsaget af yderligere formørkelser i det firedobbelte system resulterer i et mere kompliceret mønster. Kredit:NASAs Goddard Space Flight Center
Et spil skak har 20 mulige åbningstræk. Forestil dig at blive bedt om at starte et spil med titusinder af åbninger i stedet for. Det var den opgave, der blev tildelt Adam Friedman, en sommerpraktikant i 2020 ved NASAs Goddard Space Flight Center i Greenbelt, Maryland. En skakmester i gymnasiet, Friedman analyserede sin modstander - en syndflod af data om lysstyrkeændringerne for over 70 millioner stjerner.
Ved at bruge traditionelle beregningsmetoder, opgaven med at gennemsøge og klassificere disse målinger kunne have taget måneder. Med brug af maskinlæring, en form for kunstig intelligens, dette kan opnås på få sekunder. Arbejder med Brian Powell, en dataforsker i High Energy Astrophysics Science Archive Research Center i Goddard, Friedman trænede et computersystem til at identificere en vigtig klasse af variable stjerner uden eksplicit at programmere det til at gøre det.
Maskinlæring gør det muligt for computere at behandle og sortere enorme mængder data automatisk - lige hvad der var nødvendigt for at gennemskue strømmen af stjernedata. At gøre dette, Powell skabte et neuralt netværk - en række matematiske regler, der forsøger at genkende underliggende relationer i data gennem en proces, der efterligner, på en meget forenklet måde, hvordan den menneskelige hjerne fungerer. For at et neuralt netværk skal fungere, selvom, den skal trænes.
"Praktiken handlede om at indsamle træningsdata, " sagde Friedman, "fordi maskinlæring virker ved at samle et utroligt stort antal eksempler for at træne modellen."
NASA's Transiting Exoplanet Survey Satellite (TESS) blev lanceret i april 2018 for at finde nye verdener ud over vores solsystem, eller exoplaneter, ved at overvåge lysstyrkeændringer i nærliggende stjerner. Siden lanceringen, TESS har observeret næsten hele himlen. Hver anden uge, satellitten sender flere tusinde store billeder tilbage, kaldet full-frame billeder af et forud planlagt udsnit af himlen.
Astronomer bruger dataene til at konstruere lyskurver, grafer, der viser, hvordan en stjernes lysstyrke skifter over tid. Fra de rå TESS-data, Powell brugte 129, 000-kerne Opdag supercomputer på NASA's Center for Climate Simulation (NCCS) i Goddard for at bygge millioner af lyskurver.
"Takket være støtte fra NCCS, vi kunne begynde at bygge lyskurver i massive mængder. Vi har cirka 70 millioner nu, med mere på vej. Datavidenskab og maskinlæring kan hjælpe med at drive disse opdagelser, gør det muligt at sortere og behandle store mængder data hurtigere og mere præcist end nogensinde før, " sagde Powell.
Ud af denne enorme stak, Friedman ønskede at identificere formørkende binære filer, parrede stjerner, der skiftevis passerer foran, eller transit, hinanden hver bane set fra Jorden. Under hver formørkelse, systemet dæmpes, når den ene stjerne passerer foran den anden, hvilket giver et dyk i sin lyskurve. "Den virkelig nyttige funktion ved at formørke binære filer, og grunden til, at de er rygraden i astrofysikken, er, at de giver os direkte målinger af deres grundlæggende egenskaber, såsom deres masse og størrelse, sagde Veselin Kostov, en forsker ved Goddard og SETI Institute i Mountain View, Californien. "Og gennem disse egenskaber, vi kan direkte måle afstande til disse systemer. De giver os en af de meget få muligheder for at måle direkte afstande i universet."
NCCS leverede også deres Advanced Data Analytics PlaTform Graphics Processing Unit Cluster til at køre det neurale netværk, som Powell kodede og Friedman trænede.
Friedman kunne indtaste en lyskurve og instruere det neurale netværk til at tildele det til en bestemt kategori. Efter at have gentaget denne handling tusindvis af gange, det neurale netværk begyndte at genkende grupper af lyskurver og foreslå klassifikationer baseret på sandsynligheden for, at en given kurve passer ind i en given gruppe. Friedman fandt eksempler på lyskurver for en bred vifte af stjernesystemer og indlæste dem, indtil netværket lærte, hvordan de hver især så ud og kunne identificere nye lyskurver autonomt. Dette gjorde det muligt at udføre en opgave, der ville have taget måneder på en moderne stationær computer, på få sekunder.
Maskinlæring forbedrer i høj grad effektiviteten af at finde disse stjernesystemer i titusinder af TESS-billeder ved at lære at identificere kendetegnene ved en formørkelse og mærke lyskurven i overensstemmelse hermed. Men Friedman bemærkede snart en særhed i nogle af de lyskurver, som netværket havde hævdet, formørkede binære kandidater. De havde ekstra dips.
Lejlighedsvis, stjernesystemer kan have mere end to komponenter. Hvis disse stjerner formørker hinanden, så vil lyskurven have yderligere dæmpninger, der ved første øjekast, vises med ujævne mellemrum. Friedman opdagede, at de var kandidater til multistjernesystemer og begyndte derefter en udtømmende søgning efter lignende systemer blandt de formørkende binære filer identificeret af det neurale netværk. I alt, Friedman fandt otte nye kandidat-firdobbelte stjernesystemer. Disse cases er interessante, fordi de giver indsigt i, hvordan multistjernesystemer dannes og udvikler sig.
Friedman havde netop afsluttet sit første år som datalogi hovedfag ved University of Michigan, og, i starten af sommeren, havde ingen baggrund i astronomi, højtydende databehandling, datavidenskab, eller maskinlæring. Forener kompleksiteten af den aktuelle opgave, Friedman udførte sin praktik hjemmefra på grund af COVID-19, men på trods af disse udfordringer, Powell sagde, at han fangede hurtigt.
"Han er intet mindre end genial, " sagde Powell. "Adam har en uhyggelig evne til at se afvigelser fra periodicitet i lyskurver." Med et så kosmisk dybt resultat fra hans praktikophold, det er let at glemme forløbet af Friedmans fremskridt. "Det er ikke sådan, at han var astronom og maskinlæringsekspert i starten af sommeren, " tilføjede han. "Hans evne til at mestre ekstremt komplekse koncepter og færdigheder på så kort tid er forbløffende."
Friedman var taknemmelig for sin tid med Powell i løbet af sommeren. Han sagde:"Jeg er nødt til at give stor ære til Brian. Han var en utrolig mentor; han var absolut den bedste supervisor, jeg nogensinde har mødt. Han mødtes med mig hver eneste dag, bare for at lære mig, hvordan man laver projektet. Han var virkelig en fantastisk lærer."