Placering af tre ZTF-felter analyseret i dette arbejde med markerede anomali-kandidater. Kredit:Maria Pruzhinskaya (2020)
SNAD-teamet, et internationalt netværk dannet af forskere fra Rusland, Frankrig og USA, har udviklet en pipeline til at finde sjældne og eksotiske objekter blandt høstakkene af data fra astronomiske undersøgelser.
I betragtning af den stadigt stigende størrelse af astronomiske datasæt, selvom vores teleskoper opdager uventede interessante astronomiske fænomener, det er meget usandsynligt, at vi vil være i stand til at genkende dem i midten af millioner eller endda milliarder af observationer. Løsningen ligger i automatiske værktøjer, der er specielt designet til at genkende usædvanlig adfærd skjult blandt milliarder af målinger. Nogle af disse værktøjer findes allerede og anvendes, for eksempel, at identificere svindel kreditkortaktiviteter blandt millioner af transaktioner hver dag. Imidlertid, deres tilpasning til videnskabelige data er ikke ligetil på grund af komplikationer opstået fra arten af observationer i astronomi. SNAD-teamet har arbejdet i 3 år med udvikling og tilpasning af sådanne løsninger til astronomi-sammenhæng.
Under deres sidste årsmøde, gruppen fokuserede deres indsats på objekter, hvis lysstyrke varierer i tid. Pipelinen kombinerer styrkerne ved maskinlæringsalgoritmer og den uerstattelige viden fra menneskelige eksperter for at bygge et robust værktøj til registrering af anomalier. Artiklen beskriver resultater fra anvendelsen af denne ramme på den tredje dataudgivelse af Zwicky Transient Facility. Dens tre-trins proces involverede funktionsekstraktion på lyskurver (som sporer lysstyrken af objekter over tid), søg efter anomali-kandidater ved hjælp af flere maskinlæringsalgoritmer og manuel filtrering af kandidater af en menneskelig ekspert. Denne sidste fase omfattede også at udføre observationer med andre teleskoper, når det var muligt. I dette studie, 4 automatiske indlæringsalgoritmer blev brugt til at markere 277 anomali-kandidater til menneskelig undersøgelse - ud af et indledende datasæt på 2,25 millioner objekter.
Gruppen udviklede også en specialdesignet webgrænseflade, som muliggjorde øjeblikkelig visualisering og krydsmatch af hver kandidat med eksisterende astronomiske kataloger. Dette blev konstrueret for at lette arbejdet for de eksperter, der har brug for at korrelere anomali-kandidaterne med enhver anden offentligt tilgængelig information om de himmelkoordinater, der undersøges.
Fra de 277 genstande, som maskinen betragter som unormale, 188 (68%) viste sig at vise usædvanlige træk på grund af ikke-astrofysiske effekter (inklusive defekter på grund af ZTF's billedsubtraktionspipeline), 66 (24%) var objekter, der allerede var katalogiseret før, og 23 (8%) var tidligere ukendte objekter. Den første kategori omfatter nogle morsomme kuriositeter og de to sidstnævnte sager af videnskabelig interesse. For eksempel, et objekt, der blev markeret som anomali af maskinen, var faktisk okkulteringen af en baggrundsstjerne af Barcelona-asteroiden, som set fra en observatørs synspunkt fra Jorden blev detekteret som en variabel punktkilde, mens hverken stjernen eller asteroiden i virkeligheden ændrede lysstyrken. Forfatterne karakteriserede også tilbagevendende og eksotiske billedsubtraktionsartefakter, som interfererer med lyskurveanalyse og kan narre en anomalidetektionspipeline til at tro, at den er en ægte, unormalt objekt. For at hjælpe med hurtigt at sortere den første klasse fra de resterende kandidater, de var i stand til at identificere en simpel todimensionel relation, som kan bruges til at hjælpe med at filtrere potentielt falske lyskurver i fremtidige undersøgelser.
Blandt den anden og tredje kategori, forfatterne fandt fire supernovakandidater, seks tidligere uklassificerede formørkelsesbinære filer, fire præ-main-sequence-kandidater, en mulig rød dværgblus, og spektroskopisk bekræftet en RS Canum Venaticorum-stjerne, blandt andre anomali-kandidater.
Hurtig og ubesværet adskillelse af artefakter fra interessante anomali-kandidater er afgørende for nuværende og snart nærmer sig næste generations observatorier, såsom Vera Rubin Observatory Legacy Survey of Space and Time (LSST). LSST vil generere omkring 10 millioner transiente kilder pr. nat – sofistikerede og robuste algoritmer vil være nødvendige for at gennemsøge al den data, så uventede og interessante objekter ikke går glip af, og videnskabsmænd kan bedre forstå disse rummærkeligheder.
Hovedforfatter Konstantin Malanchev, forsker ved University of Illinois i Urbana-Champaign (USA) og Sternberg astronomiske institut i Lomonosov Moskva (Rusland), siger, "At designe specifikt dedikerede værktøjer til at søge efter astrofysisk interessante anomalier er vores eneste mulighed for at sikre fuld udnyttelse af datasæt, vi kæmpede så hårdt for at erhverve. SNAD-teamet er fuldt ud forpligtet til at hjælpe det astronomiske samfund med at udforske det fulde potentiale af fremtidige datasæt ."
Artiklen er blevet godkendt til offentliggørelse i Månedlige meddelelser fra Royal Astronomical Society og er også offentligt tilgængelig som fortryk. Kildekoden og resultaterne, inklusive en komplet liste over objekter med potentiel videnskabelig anvendelse, såvel som pipeline-teknikkerne, er åbne for offentligheden til gavn for og verifikation af det astronomiske samfund.