Kredit:University of Manchester
Forskere fra University of Manchester, der arbejder på et revolutionerende teleskopprojekt, har udnyttet kraften i distribueret computing fra Storbritanniens GridPP -samarbejde for at tackle et af universets største mysterier - mørket stof og mørk energi.
Forskere ved University of Manchester har brugt ressourcer fra GridPP - der repræsenterer Storbritanniens bidrag til computergitteret, der bruges til at finde Higgs -bosonen ved CERN - til at køre billedbehandling og maskinlæringsalgoritmer på tusindvis af billeder af galakser fra den internationale Dark Energy Undersøgelse.
Manchester -teamet er en del af samarbejdsprojektet om at bygge Large Synoptic Survey Telescope (LSST), et nyt slags teleskop, der i øjeblikket er under opførelse i Chile og designet til at foretage en 10-årig undersøgelse af det dynamiske univers. LSST vil kunne kortlægge hele den synlige himmel.
Som forberedelse til, at LSST startede sin revolutionerende scanning, et pilotforskningsprojekt har hjulpet forskere med at opdage og kortlægge den kosmiske forskydning set på tværs af nattehimlen, et af fortælle-tegnene på det mørke stof og den mørke energi tænkte at udgøre omkring 95 procent af det, vi ser i universet. Dette vil igen hjælpe med at forberede analysen af de forventede 200 petabyte data, LSST vil indsamle, når det begynder at fungere i 2023.
Pilotforskningsteamet baseret på The Manchester of University blev ledet af Dr. Joe Zuntz, en kosmolog oprindeligt ved Manchesters Jodrell Bank Observatory og nu forsker ved Royal Observatory i Edinburgh.
"Vores overordnede mål er at tackle mysteriet om det mørke univers - og dette pilotprojekt har været enormt betydningsfuldt. Når LSST er fuldt ud i drift, vil forskere stå over for en galaktisk dataflod - og vores arbejde vil forberede os på den analytiske udfordring, der ligger forude, " sagde Sarah Bridle, Professor i astrofysik.
Dr. George Beckett, LSST-UK Science Center Project Manager baseret på University of Edinburgh, tilføjede:"Piloten har været en stor succes. Efter at have afsluttet arbejdet, Joe og hans kolleger er i stand til at udføre forskydningsanalyse på store billedsæt meget hurtigere, end det var tilfældet tidligere. Tak til medlemmerne af GridPP -samfundet for deres hjælp og støtte hele vejen igennem. "
LSST vil producere billeder af galakser i en lang række frekvensbånd i det synlige elektromagnetiske spektrum, med hvert billede, der giver forskellige oplysninger om galakseens natur og historie. I svundne tider, de målinger, der er nødvendige for at bestemme egenskaber som kosmisk forskydning, kan have været udført i hånden, eller i det mindste med computerovervåget computerbehandling.
Med de milliarder af galakser, der forventes at blive observeret af LSST, sådanne fremgangsmåder er umulige. Specialiseret billedbehandling og maskinlæringssoftware (Zuntz 2013) er derfor blevet udviklet til brug med galaksebilleder fra teleskoper som LSST og dets forgængere. Dette kan bruges til at producere kosmiske forskydningskort. Udfordringen bliver derefter en med at behandle og administrere data for hundredtusindvis af galakser og udvinde videnskabelige resultater, der kræves af LSST-forskere og det bredere astrofysiske samfund.
Da hver galakse i det væsentlige er uafhængig af andre galakser i kataloget, selve billedbehandlingsarbejdsprocessen er yderst paralleliserbar. Dette gør det til et ideelt problem at tackle med den type High-Throughput Computing (HTP) ressourcer og infrastruktur, der tilbydes af GridPP. På mange måder, dataene fra CERNs Large Hadron Collider-partikelkollisionshændelser er som dem, der produceres af et digitalkamera (faktisk, pixel-baserede detektorer bruges nær interaktionspunkterne) – og GridPP behandler regelmæssigt milliarder af sådanne hændelser som en del af Worldwide LHC Computing Grid (WLCG).
En pilotøvelse, ledet af Dr. Joe Zuntz på University of Manchester og understøttet af en af de længst fungerende og mest erfarne GridPP -eksperter, Senior systemadministrator Alessandra Forti, så porten af billedanalyse -arbejdsgangen til GridPPs distribuerede computerinfrastruktur. Data fra Dark Energy Survey (DES) blev brugt til piloten.
Efter at have overført disse data fra USA til GridPP Storage Elements, og muliggøre LSST Virtual Organization på en række GridPP Tier-2-websteder, IM3SHAPE analysesoftwarepakken (Zuntz, 2013) blev testet på lokale, netvenlige klientmaskiner for at sikre jævn kørsel på nettet. Analysejobs blev derefter indsendt og administreret ved hjælp af Ganga -softwarepakken, som er i stand til at koordinere de tusindvis af individuelle analyser forbundet med hver batch af galakser. De indledende kørsler blev indsendt ved hjælp af Ganga til lokale netsteder, men piloten gik videre til indsendelse til flere websteder via tjenesten GridPP DIRAC (Distributed Infrastructure with Remote Agent Control). Fleksibiliteten i Ganga tillader begge typer indsendelse, hvilket gjorde overgangen fra lokal til distribueret drift væsentligt nemmere.
Ved slutningen af piloten, Dr Zuntz var i stand til at køre billedbehandlingsarbejdsprocessen på flere GridPP -websteder, regelmæssigt indsende tusindvis af analysejob på DES -billeder.