I en proof of concept-test for Project Silica, Microsoft og Warner Bros. har med succes lagret og læst den klassiske "Superman"-film fra 1978 på et 7,5 cm x 7,5 cm x 2 mm stykke holdbart silicaglas - nogenlunde på størrelse med en drink-coaster. Glasset indeholder 75,6 GB data plus fejlredundanskoder. Kredit:Jonathan Banks for Microsoft.
Microsoft og Warner Bros. har samarbejdet om med succes at opbevare og hente hele den ikoniske "Superman"-film fra 1978 på et stykke glas, der er nogenlunde på størrelse med en drink-coaster, 75 gange 75 gange 2 millimeter tyk.
Det var den første proof of concept-test for Project Silica, et Microsoft Research-projekt, der bruger nyere opdagelser inden for ultrahurtig laseroptik og kunstig intelligens til at lagre data i kvartsglas. En laser koder data i glas ved at skabe lag af tredimensionelle nanoskala gitre og deformationer i forskellige dybder og vinkler. Maskinlæringsalgoritmer læser data tilbage ved at afkode billeder og mønstre, der skabes, når polariseret lys skinner gennem glasset.
Det hårde silicaglas kan tåle at blive kogt i varmt vand, bagt i ovnen, mikrobølgeovn, oversvømmet, skuret, afmagnetiserede og andre miljøtrusler, der kan ødelægge uvurderlige historiske arkiver eller kulturskatte, hvis det går galt.
Det repræsenterer en investering fra Microsoft Azure i at udvikle lagringsteknologier bygget specifikt til cloud computing-mønstre, i stedet for at stole på lagermedier designet til at fungere i computere eller andre scenarier. Det er blot en af mange måder, hvorpå Azure er afhængig af Microsofts forskningsekspertise til at løse både nær- og langsigtede udfordringer – fra Project Naticks undervandsdatacentertest til Project Brainwaves FPGA-processorkraft og den nye Optics for the Cloud-forskning.
"At gemme hele 'Superman'-filmen i glas og være i stand til at læse den op med succes er en stor milepæl, " sagde Mark Russinovich, Azures teknologichef. "Jeg siger ikke, at alle spørgsmålene er blevet fuldt besvaret, men det ser ud til, at vi nu er i en fase, hvor vi arbejder på forfining og eksperimentering, hellere stille spørgsmålet 'kan vi gøre det?'"
Warner Bros., som henvendte sig til Microsoft efter at have lært af forskningen, er altid på jagt efter nye teknologier for at beskytte sit enorme bibliotek:historiske skatte som "Casablanca, "1940'ernes radioprogrammer, animerede shorts, digitalt optaget teaterfilm, tv sitcoms, dagblade fra filmoptagelser. Årevis, de havde søgt efter en lagringsteknologi, der kunne holde i hundreder af år, modstå oversvømmelser eller soludbrud, og det kræver ikke, at det holdes ved en bestemt temperatur eller skal konstant opfriskes.
"Det havde altid været vores fyrtårn af håb om, hvad vi troede ville være muligt en dag, så da vi fandt ud af, at Microsoft havde udviklet denne glasbaserede teknologi, vi ville bevise det, " sagde Warner Bros. teknologichef Vicky Colf.
Reducer omkostningerne ved langtidsopbevaring
De fleste mennesker tænker på "skyen" som en måde at gemme alt fra tusindvis af familiebilleder til millioner af e-mails uden at optage plads på din telefon eller computer. Men al den information bliver fysisk gemt på hardware et fjerntliggende sted, giver dig adgang til det fra flere enheder.
Mængden af data, menneskeheden nu søger at gemme – fra medicinske journaler til sjove kattevideoer til billeder taget med rumfartøjer – eksploderer samtidig med, at kapaciteten af eksisterende lagringsteknologier flader ud.
Microsoft senior optisk videnskabsmand James Clegg indlæser et stykke glas i et system, der bruger optik og kunstig intelligens til at hente og læse data gemt på glas. Kredit:Jonathan Banks for Microsoft.
Langsigtede lageromkostninger er drevet op af behovet for gentagne gange at overføre data til nyere medier, før informationen går tabt. Harddiske kan slides efter tre til fem år. Magnettape holder måske kun fem til syv. Filformater bliver forældede, og opgraderinger er dyre. I sine egne digitale arkiver, for eksempel, Warner Bros. migrerer proaktivt indhold hvert tredje år for at være på forkant med nedbrydningsproblemer.
Glaslagring har potentiale til at blive en billigere mulighed, fordi du kun skriver dataene på glasset én gang. Femtosekundlasere - dem, der udsender ultrakorte optiske impulser, og som er almindeligt anvendt i LASIK-kirurgi - ændrer permanent glassets struktur, så dataene kan bevares i århundreder.
Kvartsglas har heller ikke brug for energikrævende aircondition for at holde materialet ved en konstant temperatur eller systemer, der fjerner fugt fra luften - som begge kan sænke det miljømæssige fodaftryk af datalagring i stor skala.
"Vi forsøger ikke at bygge ting, som du sætter i dit hus eller afspille film fra. Vi bygger lager, der fungerer i skyskalaen, " sagde Ant Rowstron, partner vicelaboratoriedirektør for Microsoft Research Cambridge i Storbritannien, som samarbejdede med University of Southampton om at udvikle Project Silica.
"En stor ting, vi ønskede at eliminere, er denne dyre cyklus med flytning og omskrivning af data til næste generation. Vi vil virkelig gerne have noget, du kan lægge på hylden for 50 eller 100 eller 1, 000 år og glem det, indtil du har brug for det, " sagde Rowstron.
Project Silica sigter mod at gemme det, der er kendt som "kolde" data - arkivdata, der kan have enorm værdi, eller som virksomheder er forpligtet til at vedligeholde - men det behøver ikke at blive tilgået ofte. Det kan omfatte medicinske data, der skal opbevares i hele en patients liv, data om finansiel regulering, juridiske kontrakter, geologisk information, der vedrører energiudforskning og byggeplaner, som byer skal holde fast i.
Warner Bros. var meget interesseret i at hjælpe Microsoft med at teste løsninger, der kunne afhjælpe omkostningerne og ineffektiviteten forbundet med lagring af data over disse lange tidshorisonter, sagde Colf.
"Med det største indholdsbibliotek i medie- og underholdningsindustrien efter mange mål, vores udfordringer er unikke i deres omfang, men de er bestemt ikke unikke i forhold til det problem, vi forsøger at løse, " hun sagde.
At omdanne digitale data til fysiske artefakter
Med en næsten 100-årig historie inden for film og tv, Warner Bros. ejer et af verdens dybeste og mest betydningsfulde underholdningsbiblioteker. Genudgivelse af ældre film i nye formater eller til nye målgrupper er en vigtig del af forretningen. Det er også et enormt kulturelt ansvar at bevare nogle af verdens mest elskede historier i al evighed, sagde Colf.
"Forestil dig, hvis en titel som 'Troldmanden fra Oz' eller et show som 'Venner' ikke var tilgængelig for generation efter generation at nyde og se og forstå, " sagde hun. "Vi synes, det er utænkeligt, og det er derfor, vi tager arbejdet med at bevare og arkivere vores indhold ekstremt alvorligt."
Virksomheden har afskedigelsesplaner på plads for at håndtere flere worst-case scenarier:et jordskælv eller orkan, der rammer en af kysterne, en brand, hvor undertrykkelsessystemerne ikke slår ind, eller en klimakontrolsvigt, der tillader fugt at opbygge og ødelægge filmbeholdningen.
Målet er at have tre arkivkopier af hvert aktiv opbevaret forskellige steder rundt om i verden:to separate digitaliserede kopier, sammen med den originale fysiske kopi på hvilket medie en film eller tv-episode eller tegnefilm blev skabt.
Heldigvis, originale filmnegativer vil holde i århundreder, hvis de opbevares under de rigtige forhold. Men for nogle ældre tv-shows – tænk på episoder af "Alice" optaget i 1970'erne – har den originale fysiske kopi en begrænset holdbarhed, der kræver migrering til nyere formater. Og for nutidens film og tv-shows, der er optaget digitalt, det tredje eksemplar i arkivkvalitet har en meget kort migrationscyklus på tre til fem år, som er udfordrende at styre.
"Lad os sige, at et tv-program skubber direkte ind i vores digitale arkiver; der er ikke noget fysisk, " sagde Steven Anastasi, Warner Bros. vicepræsident for globale mediearkiver og bevaringstjenester. "Den digitale fil går ind, men jeg har ikke noget, jeg kan lægge i en hvælving eller i en saltmine eller noget fysisk, der kommer ind i bygningen."
Warner Bros. ser potentielt på Project Silica for at skabe et permanent fysisk aktiv til at gemme vigtigt digitalt indhold og levere holdbare sikkerhedskopier. Lige nu, til biografudgivelser, der er optaget digitalt, virksomheden opretter en tredje arkivkopi ved at konvertere den tilbage til analog film. Det opdeler de endelige optagelser i tre farvekomponenter - cyan, magenta og gul – og overfører hver til sort-hvide filmnegativer, der ikke falmer som farvefilm.
Disse negativer lægges i et kølearkiv. I disse højt administrerede hvælvinger, temperatur og luftfugtighed kontrolleres nøje, og luftsniffere leder efter tegn på kemisk nedbrydning, der kan signalere problemer. Hvis de skal have filmen tilbage, de skal vende de komplicerede trin.
Den proces er dyr, og der er kun en håndfuld filmlaboratorier tilbage i verden, der kan gøre det. Og processen er ikke optimal fra et kvalitativt synspunkt, sagde Brad Collar, Warner Bros. senior vicepræsident for globale arkiver og medieteknik.
"Når vi optager noget digitalt - med nuller og ettaller, der repræsenterer pixels på skærmen ¬ - og udskriver det til et analogt medie kaldet film, du ødelægger de originale pixelværdier. Og, jo da, det ser godt ud, men det er ikke reversibelt, " sagde Collar.
"Hvis vi kan tage den digitale repræsentation af disse pixels og sætte det på et medium som silica og læse det tilbage præcis, som det var, da det kom ud af kameraet, vi har udført vores bevaringsarbejde efter bedste evne. Det er det, jeg elsker ved det her, " han sagde.
Brad Collar, Warner Bros. senior vicepræsident for globale arkiver og medieteknik, venstre, og Vicky Colf, Warner Bros. teknologichef, demonstrere kontrasten mellem opbevaring af film på 22 ruller film versus et stykke glas i coaster-størrelse. Kredit:John Brecher for Microsoft.
Det er ikke økonomisk at skabe arkivfilmnegativer til hver digitalt optaget tv-episode i Warner Bros.-biblioteket. Virksomheden håber, at Project Silica kan vise sig at være en billigere, højere kvalitet alternativ til at skabe fysiske arkiver af digitalt indhold.
Der er meget mere arbejde forude for at nå den skala – Microsofts forskere ville være nødt til at øge hastigheden, hvormed data kan skrives og læses markant, samt dens tæthed. Warner Bros. forestiller sig sin egen infrastruktur til at læse data fra glasarkiverne. Men begge partnere ser lovende i, hvor langt de er nået.
"Hvis Project Silicas lagringsløsning viser sig at være så omkostningseffektiv og skalerbar, som den kunne være - og vi anerkender alle, at det stadig er tidligt - er dette noget, vi ville elske at se adopteret af andre studier og vores kolleger og andre industrier, " sagde Colf.
"Hvis det virker for os, vi er overbevist om, at dette vil være en fordel for alle, der ønsker at bevare og arkivere indhold, " hun sagde.
Design af storage til skyen
Det er umuligt at vide, hvor meget information der er gået tabt, fordi ingen indså dens værdi på det tidspunkt – fra stumfilm, som ingen havde forestillet sig nogensinde ville blive set uden for et biograf, til historiske data, som moderne analytiske værktøjer og AI kunne hente ny indsigt fra.
Et mål med Microsofts næste generation af lagerforskning, som omfatter parallelle bestræbelser på at lagre data i DNA, er at udvikle løsninger, der er billige nok og ubesværede nok til, at du egentlig ikke behøver at træffe et valg om, hvorvidt du vil gemme dine data, siger firmaet.
Microsoft-forskere brugte år på at prøve at nå dertil med teknologier, der i øjeblikket bruges i datacentre. Men størrelsen, form og begrænsninger af ting som spooling tape og roterende diske – som alle blev opfundet til andre formål længe før skyen eksisterede – kunne simpelthen ikke skaffe dem de gevinster, de ønskede.
"Til sidst, vi tænkte bare 'kan vi bygge noget fra bunden til skyen, som ikke behøver at gøre andet?'" sagde Rowstron.
De lancerede et samarbejde med University of Southampton Optoelectronic Research Centre, hvor forskere oprindeligt demonstrerede, hvordan man lagrer data i glas med femtosekund-lasere. Med investering fra Azure, Microsofts Cambridge, Storbritannien, laboratoriet byggede et tværfagligt team af fysikere, optik eksperter, elektroingeniører og forskere med opbevaringsbaggrunde for at skubbe teknologien videre.
Microsoft Project Silica-forsker Youssef Assaf taber en firkant af silicaglas i en kedel med kogende vand for at demonstrere dets holdbarhed. Holdet har bagt, kogt, mikrobølgeovn, afmagnetiseret og skuret lignende stykker glas med ståluld - uden tab af data gemt indeni. Kredit:Jonathan Banks for Microsoft.
Siden da, Microsoft Research-teamet har opnået dramatiske fremskridt i hastighed og præcision. De har også arbejdet tæt sammen med deres Azure-kolleger for at designe Project Silica med de daglige udfordringer og krav til kommerciel cloud-lagring i tankerne.
"At få alle deres input og tænkning ind i projektet fra dag 1 betyder, at vi til sidst vil generere noget, som virkelig er brugbart for dem, " Rowstron sagde om forholdet til Azure-produktteamet.
Project Silicas infrarøde lasere koder data i "voxels, " den tredimensionelle ækvivalent af de pixels, der udgør et fladt billede. I modsætning til andre optiske lagringsmedier, der skriver data på overfladen af noget, Project Silica gemmer data i selve glasset. Et 2 mm tykt stykke glas, for eksempel, kan indeholde mere end 100 lag voxels.
Data indkodes i hver voxel ved at ændre styrken og orienteringen af intense laserimpulser, der fysisk deformerer glasset. Det er lidt som at skabe omvendte isbjerge på nanoskalaniveau, med forskellige dybder og størrelser og riller, der gør dem unikke.
For at læse data tilbage, maskinlæringsalgoritmer afkoder de mønstre, der skabes, når polariseret lys skinner gennem glasset. I modsætning til båndopbevaring - som det tager tid at spolere for at komme til det sted, du vil læse tilbage - kan algoritmerne hurtigt nulstilles på et hvilket som helst punkt i glasfirkanten, potentielt reducere forsinkelsestiden til at hente information.
"Hvis du er gammel nok til at huske at spole tilbage og videresende sange på kassettebånd, det kan tage et stykke tid at komme til den del, du ønsker, " sagde Richard Black, Microsofts primære forskningssoftwareingeniør. "Derimod det er meget hurtigt at læse tilbage fra glas, fordi du kan bevæge dig samtidigt inden for x- eller y- eller z-aksen."
I modsætning til skrøbelige vinglas eller pærer, kvadraterne af kvartsglas, der bruges til datalagring, er overraskende svære at ødelægge. Tidligt, forskerholdet prøvede at bage en i en ovn ved 500 grader, mikroovn, koger det, skure den med ståluld. Og når de læser data tilbage, det hele var der stadig.
Det gav fuldstændig mening for Warner Bros. arkivarerne, som for år siden opdagede æsker med Superman-radioserier optaget i 1940'erne på rekordstore glasstykker.
"Vi fandt faktisk spillere, som vi kunne spille disse ting tilbage på, og de var lige så gode, fordi de blev opbevaret på glas. Og vi var i stand til at digitalisere og gemme disse vidunderlige stykker indhold, " sagde Collar.
"Så nu er et af vores ældste aktiver i vores hvælving glas, og en af de nyeste teknologier i vores hvælving er glas. Og de er begge Superman. Så vi er virkelig kommet fuld cirkel, " han sagde.