Videnskab
 science >> Videnskab >  >> Fysik

CMS frigiver mere end en petabyte af åbne data

En kollisionshændelse registreret af CMS i 2012, der viser en "Higgs -kandidat", tilgængelig på CERN Open Data -portalen med den seneste version af CMS Open Data. Kredit:Tom McCauley/CMS/CERN

CMS Collaboration hos CERN har netop offentliggjort omkring halvdelen af ​​de data, der blev indsamlet i 2012 af CMS -detektoren ved Large Hadron Collider. Denne udgivelse indeholder sæt, der bruges til at opdage Higgs -bosonen, og deles via CERN Open Data -portalen.

Dette er den tredje udgivelse af CMS Open Data på højt niveau, efter offentliggørelsen af ​​2010 -data i 2014, og 2012-data i 2016. Denne batch indeholder mere end 550 terabyte proton-proton-kollisionsdata, der er registreret ved en masse-masseenergi på 8 TeV samt omkring 510 terabyte Monte Carlo-simuleringsdata.

LHC -data er komplicerede og store. CMS -forskere har registreret petabyte data fra kollisioner ved LHC og har indtil nu offentliggjort hundredvis af videnskabelige artikler med dem. Ved at frigive dataene til det offentlige domæne, forskere uden for CMS Collaboration har mulighed for at udføre ny forskning med dem.

"Vores data er et vigtigt element i CMS Collaborations rige videnskabelige arv, "siger talsmand for CMS, Joel Butler. "Vi vil gerne sikre, at de ikke kun bevares i det lange løb, men også er tilgængelige for offentligheden, så både CMS-medlemmer og eksterne forskere kan undersøge dem igen i fremtiden. Dette er en del af vores forpligtelse til åbenhed og langsigtet bevarelse af data. "

Animation, der viser en "Higgs -kandidat" -begivenhed, registreret af CMS i 2012 og tilgængelig på CERN Open Data -portalen med den seneste version af CMS Open Data. Kredit:Tom McCauley og Achintya Rao CMS/CERN

For nylig, de to første sådanne forskningsartikler blev udgivet af et team af teoretikere på MIT, der var interesseret i at foretage en måling, som CMS-forskere ikke selv havde foretaget:specifikt ønskede de at måle bestemte understrukturer i klynger af partikler kendt som "jetfly" produceret i proton-protonkollisioner.

Den seneste udgivelse af CMS Open Data har også den fascinerende mulighed for at tillade folk at gentage den analyse, der førte til Higgs -opdagelsen, ved at studere de samme data, der blev brugt af CMS -forskere til at annoncere partikelens eksistens i 2012. Som et bevis på konceptet, CMS -doktorand Nur Zulaiha Jomhari analyserede CMS Open Data og producerede parceller, der lignede nogle af dem, der blev vist, da Higgs -opdagelsen blev annonceret. Denne analyse er meget mindre sofistikeret end den officielle CMS og er ikke undersøgt af det bredere CMS -fællesskab af eksperter, men det demonstrerer potentialet ved CMS Open Data.

Til venstre:Det officielle CMS -plot for kanalen "Higgs to four leptons", vist på dagen for Higgs -opdagelsesmeddelelsen. Til højre:Et lignende plot produceret af Nur Zulaiha Jomhari et al. ved hjælp af CMS Open Data fra 2011 og 2012. Selvom parcellerne ligner hinanden, analysen med CMS Open Data bruger flere data (ved 8 TeV og samlet) end den officielle CMS fra den oprindelige opdagelse, men er meget mindre sofistikeret og undersøges ikke af det bredere CMS -fællesskab af eksperter. Kredit:CMS/CERN

Ud over selve datasættene, CMS Data Preservation og Open Data team har også samlet en omfattende samling af supplerende materialer, herunder eksempelkode til udførelse af relativt enkle analyser, samt metadata såsom information om, hvordan data blev valgt, og hvad LHC's driftsbetingelser var under dataindsamlingen.

I øjeblikket, CMS har forpligtet sig til at frigive op til 50% af hvert års registrerede data et par år efter, at de blev indsamlet, når CMS -forskere er færdige med det meste af deres analyse af disse datasæt. "At se vores åbne data i brug uden for CMS har været meget givende, "siger Kati Lassila-Perini, CMS-datakonservering og Open Access-koordinator. "Det har været en stor motivation for os, og vi ser frem til at fortsætte vores banebrydende indsats for at frigive åbne data fra forskningskvalitet fra LHC i de kommende år."