Videnskab
 science >> Videnskab >  >> Fysik

Stor Hadron Collider presser computeren til det yderste

Stativer med computere i CERNs computercenter er kun en brøkdel af den hardware, der er nødvendig for at gemme og behandle dataene fra LHC. Kredit:Anthony Grossir/CERN

Ved udgangen af ​​2018, Large Hadron Collider (LHC) gennemførte sit andet flerårige løb ("Kør 2"), der så maskinen nå en proton-proton kollision energi på 13 TeV, det højeste, der nogensinde er nået med en partikelaccelerator. Under dette løb, fra 2015 til 2018, LHC-eksperimenter producerede hidtil usete mængder af data, hvor maskinens ydeevne oversteg alle forventninger.

Dette betød ekstraordinær brug af computing, med mange rekorder brudt med hensyn til dataindsamling, datahastigheder og datamængder. CERN Advanced Storage System (CASTOR), som er baseret på et båndbaseret backend til permanent dataarkivering, nået 330 PB data (svarende til 330 millioner gigabyte) lagret på bånd, svarende til over 2000 års 24/7 HD -videooptagelse. Alene i november 2018, en rekordstor 15,8 PB data blev optaget på bånd, en bemærkelsesværdig præstation, da det svarer til mere end det, der blev registreret i løbet af det første år af LHC's Run 1.

Det distribuerede lagersystem til LHC -eksperimenterne oversteg 200 PB rå lagring med omkring 600 millioner filer. Dette system (EOS) er diskbaseret og open-source, og blev udviklet på CERN til de ekstreme krav til LHC -computing. Såvel som dette, 830 PB data og 1,1 milliarder filer blev overført til hele verden med filoverførselstjeneste. For at møde disse computerudfordringer og for bedre at understøtte CERN -eksperimenterne under kørsel 2, hele computerinfrastrukturen, og især lagersystemerne, gennemgået store opgraderinger og konsolidering i løbet af de sidste par år.

Data (i terabyte) optaget på bånd hos CERN måned for måned. Dette plot viser mængden af ​​data optaget på bånd genereret af LHC-eksperimenterne, andre forsøg, forskellige back-ups og brugere. I 2018, over 115 PB data i alt (inklusive ca. 88 PB LHC -data) blev optaget på bånd, med en rekordhøjde på 15,8 PB i november. Kredit:Esma Mobs/CERN

Nye it-forsknings- og udviklingsaktiviteter er allerede begyndt som forberedelse til LHC's Run 3 (forventet i 2021 til 2023). "Vores nye software, navngivet CERN Tape Archive (CTA), er det nye båndopbevaringssystem til den frihedsberømte kopi af fysikdata og en erstatning for dets forgænger, CASTOR. Hovedmålet med CTA er at udnytte bånddrevene mere effektivt, at håndtere den højere datahastighed, der forventes under kørsel 3 og kørsel 4 af LHC, "forklarer tyske Cancio, der leder båndet, Arkiv- og sikkerhedskopieringsafdeling i CERNs IT -afdeling. CTA vil blive indsat under den igangværende anden lange nedlukning af LHC (LS2), udskiftning af CASTOR. Sammenlignet med det sidste år af løb 2, dataarkivering forventes at være to gange højere under kørsel 3 og fem gange højere eller mere under kørsel 4 (forventet i 2026 til 2029).

LHC's computing vil fortsætte med at udvikle sig. De fleste af de data, der indsamles i CERNs datacenter, er yderst værdifulde og skal bevares og gemmes til fremtidige generationer af fysikere. CERNs IT -afdeling vil derfor drage fordel af LS2, den nuværende vedligeholdelse og opgradering af acceleratorkomplekset, at udføre den nødvendige konsolidering af computerinfrastrukturen. De vil opgradere lagerinfrastrukturen og softwaren til at klare de sandsynlige skalerbarheds- og ydelsesudfordringer, når LHC genstarter i 2021 til løb 3.