Videnskab
 science >> Videnskab >  >> Elektronik

Dine internetdata rådner

Internettet vokser, men gammel information fortsætter med at forsvinde dagligt. Kredit:wk1003mike/shutterstock.com

Mange MySpace-brugere var forfærdede over at opdage tidligere i år, at den sociale medieplatform mistede 50 millioner filer, der var uploadet mellem 2003 og 2015.

MySpaces manglende evne til at passe på og bevare brugernes indhold bør tjene som en påmindelse om, at det kan være risikabelt at stole på gratis tredjepartstjenester.

MySpace har sandsynligvis bevaret brugernes data; det har bare mistet deres indhold. Dataene var værdifulde for MySpace; brugernes indhold mindre.

Hvad skete der med MySpace

MySpace er et socialt netværksmediested, hvor kunstnere kan uploade musik eller andet indhold til adgang og distribution til dets brugerfællesskab. Det har altid været et gratis websted, med indtægter, der kommer fra annoncer og programmering, der er målrettet brugere for specifikke produkter.

Dannet i 2003 i efterligning af den sociale spilleside Friendster, MySpace voksede hurtigt og blev købt af Rupert Murdochs News Corporation i 2005. I 2008 MySpace var den førende sociale netværksside, værdi på én gang til 12 milliarder USD, men det faldt i popularitet – takket være en overhyppighed af annoncer, bekymringer om udsættelse af mindreårige for seksuelt indhold og andre problemer. I 2011 News Corporation solgte MySpace til specifikke medier, som solgte den igen i 2016 til Time Inc., som igen blev købt af Meredith Corporation i 2018.

Så virksomheden gennemgik tre ejerskifter over en 12-årig periode, og så indtægter og medlemstal falde brat over den tid. Ét salg kan være fint, men tre salg på kort sigt tyder for mig på en problemfyldt virksomhed, der ikke var i en god position til at våge over andres intellektuelle ejendom.

Enhver, der bruger MySpace som en lagertjeneste, og som ikke havde alternativ backup, er simpelthen ude af held. Du lod din intellektuelle ejendom sidde ved siden af ​​informationsmotorvejen, og da du kom tilbage 10 år senere, var den væk.

MySpace er ikke alene om at støde på problemer. Amazon skytjenester, for eksempel, oplevede også et væsentligt afbrydelse i 2011 og endnu et i 2017. Selvom det var midlertidigt, og uden faktisk tab af data, disse udfald efterlod brugere uden adgang til dyrebare og vigtige filer i nogen tid.

Et meget større problem

Bevarelse af indhold eller intellektuel ejendom på internettet udgør en gåde. Hvis det er tilgængeligt, så er det ikke sikkert; hvis det er sikkert, så er den ikke tilgængelig.

Tilgængeligt indhold er genstand for manipulation, tyveri eller andre former for dårlige handlinger. Kun indhold, der er utilgængeligt, kan låses og beskyttes mod hacking.

Internettet har i øjeblikket adgang til omkring 15 zettabyte data, og vokser med en hastighed på 70 terabyte i sekundet. Det er ganske vist et utæt fartøj, og indhold går konstant offline for at ende tabt for altid.

I en erklæring, Myspace sagde, "Vi beklager ulejligheden." Kredit:chrisdorney/shutterstock.com

Massive og desperate bestræbelser er i gang for at bevare det, der er værd at bevare, men selv at finde ud af, hvad der er, og hvad der ikke er, er i sig selv et formidabelt foretagende. Hvad vil have værdi om 10 år – eller 50 år? Og hvordan bevares det?

Syrefrit papir kan holde 500 år; stenindskrifter endnu længere. Men magnetiske medier som harddiske har en meget kortere levetid, varer kun tre til fem år. De skal også kopieres og verificeres på en meget kort livscyklus for at undgå dataforringelse ved observerede fejlrater på mellem 3 % og 8 % årligt.

Så er der også et problem med softwarebevarelse:Hvordan kan folk i dag eller i fremtiden fortolke disse WordPerfect- eller WordStar-filer fra 1980'erne, når de originale softwarevirksomheder er holdt op med at støtte dem eller er gået konkurs?

En nonprofit-startup kaldet The Internet Archive bevarer øjebliksbilleder af internettet på en løbende basis, men for det meste er dette til offentlige HTML-websider på øverste niveau, såsom The New York Times hjemmeside og Facebook, ikke til underliggende indholdsfiler. Fra sidste efterår, dens Wayback Machine holdt over 450 milliarder sider i 25 petabyte data. Dette ville repræsentere 0,0003% af det samlede internet.

Universiteter, regeringer og videnskabelige samfund kæmper for at bevare videnskabelige data i en bunke af arkiver, såsom U.K.'s Digital Preservation Coalition, MetaArkiv, eller det nu opløste samarbejdende Digital Preservation Network. Bevarelse er svært og dyrt i tide, penge og udstyr. For at være mest nyttig, det skal ikke kun opbevares, men hostet i en form, der er tilgængelig og tilgængelig til fremtidig genbrug.

Faktisk lagerplads koster mindre end $0,05 pr. gigabyte, men opbevaring er kun en lille procentdel af omkostningerne ved konservering. Erhvervelse, netværk, vedligeholdelse og administration kræver alt sammen betydeligt og dyrt menneskeligt arbejde.

Budgetteringsmodeller foreslår en 10-årig opbevaringsudgift på omkring $2,50 pr. gigabyte, eller $2, 500 pr. terabyte, eller $625, 000 for filerne, som MySpace ikke kunne bevare.

I betragtning af dine egne data

Så ja, Internettet rådner, men arkivarer og digitale bibliotekarer som jeg vidste, at det allerede var råddent, det samme gjorde enhver, der nogensinde har fået fejlen "404 File Not Found".

Hvor der er økonomisk incitament til at opbevare og bruge data – såsom brugeroplysninger, profiler eller browserhistorik – det kan eksistere i ret lang tid. Det er blevet sagt af mange, at data er den nye olie, og virksomheder er ivrige efter at bore og udnytte denne ressource.

Imidlertid, hvor indhold er mindre værdifuldt for den, der ejer serverne, der er mindre incitament til at investere i at bevare det. En undersøgelse af 10 millioner hits fra 25 tilfældige websteder i 2004 tyder på, at 404-fejl forekommer ved tæt på 3 % af de målrettede webadresser. Internettet vokser meget hurtigere, end det rådner, men begge ting sker på én gang. Ingen kæmpe internetvirksomhed har dine interesser tættere på hjertet end sine egne.

Et konserveringsnetværk er kendt under forkortelsen LOCKSS – Masser af kopier holder ting sikkert – og det er en god tommelfingerregel. Hav altid en backup, og altid have flere sikkerhedskopier. Beskyt dit privatliv og vogt dit indhold, i det mindste det indhold, du måtte ønske at have bevaret, kan lide billeder, e-mail, manuskriptet eller romanen, eller video- og musikfiler. Ophavsretsreglerne forbyder ikke lagring af indhold, du måtte have købt, så længe du ikke lægger den ud til offentlig deling.

Gratis lagerplads er et godt tilbud, men nogle gange får du kun hvad du betaler for. Internettet er hverken sikkert eller permanent. Det lovede det aldrig, og brugerne skal ikke antage, at det bliver det. Dele rådner og korroderer og falder sammen, mens jeg skriver dette. Bare håb og planlægger ikke at hvile på den platform, når den falder.

Denne artikel er genudgivet fra The Conversation under en Creative Commons-licens. Læs den originale artikel.




Varme artikler