Magnetbånd, hentet med robotarme, bruges til langtidsopbevaring. Kredit:Julian Ordan/CERN
I år slog CERNs datacenter sin egen rekord, da den indsamlede flere data end nogensinde før.
I løbet af oktober 2017, datacentret lagrede den kolossale mængde på 12,3 petabyte data. For at sætte dette i kontekst, en petabyte svarer til lagerkapaciteten på omkring 15, 000 64 GB smartphones. De fleste af disse data stammer fra Large Hadron Colliders eksperimenter, så denne rekord er et direkte resultat af den enestående LHC -ydeevne, resten består af data fra andre forsøg og sikkerhedskopier.
"De sidste ti år har datavolumen lagret på bånd ved CERN er vokset med en næsten eksponentiel hastighed. I slutningen af juni havde vi allerede bestået en milepæl for datalagring, med i alt 200 petabyte data permanent arkiveret på bånd, "forklarer tyske Cancio, der leder båndet, arkiv og backup af lagringsafsnittet i CERNs IT -afdeling.
CERN -datacenteret er kernen i organisationens infrastruktur. Her indsamles data fra hvert forsøg på CERN, det første trin i rekonstruktionen af, at data udføres, og kopier af alle eksperimenternes data arkiveres til langsigtet båndopbevaring.
De fleste data indsamlet på CERN vil blive gemt for evigt, fysikdataene er så værdifulde, at de aldrig vil blive slettet og skal bevares for fremtidige generationer af fysikere.
"Et vigtigt kendetegn ved CERN -dataarkivet er dets levetid, "Cancio tilføjer." Selv efter at et eksperiment er slut, skal alle registrerede data forblive tilgængelige i mindst 20 år, men normalt længere. Nogle af de arkivfiler, der er produceret af tidligere CERN -eksperimenter, er blevet migreret på tværs af forskellige hardware, software- og mediegenerationer i over 30 år. For arkiver som CERN's, der ikke kun bevarer eksisterende data, men også fortsætter med at vokse, vores databeskyttelse er særligt udfordrende. "
Selvom bånd kan lyde som en forældet opbevaringstilstand, de er faktisk den mest pålidelige og omkostningseffektive teknologi til store arkivering af data, og har altid været brugt inden for dette område. En kopi af data på et bånd betragtes som meget mere pålidelig end den samme kopi på en disk.
CERN administrerer i øjeblikket det største videnskabelige dataarkiv inden for High Energy Physics (HEP) domænet og bliver ved med at innovere inden for datalagring, "slutter Cancio.