Videnskab
 science >> Videnskab >  >> Fysik

Lagring af data i DNA bringer naturen ind i det digitale univers

Den næste grænse for datalagring:DNA. Kredit:ymgerman/Shutterstock.com

Menneskeheden producerer data i en ufattelig hastighed, til det punkt, at lagringsteknologier ikke kan følge med. Hvert femte år, mængden af ​​data, vi producerer, stiger 10 gange, herunder fotos og videoer. Ikke alt skal opbevares, men producenter af datalagring laver ikke harddiske og flash-chips hurtige nok til at holde det, vi ønsker at beholde. Da vi ikke vil stoppe med at tage billeder og optage film, vi er nødt til at udvikle nye måder at redde dem på.

I løbet af årtusinder, naturen har udviklet et utroligt informationsmedie – DNA. Det udviklede sig til at lagre genetisk information, tegninger til opbygning af proteiner, men DNA kan bruges til mange flere formål end blot det. DNA er også meget tættere end moderne lagringsmedier:Dataene på hundredtusindvis af dvd'er kunne passe ind i en tændstikæske-størrelse pakke med DNA. DNA er også meget mere holdbart – holder i tusinder af år – end nutidens harddiske, som kan vare år eller årtier. Og mens harddiskformater og forbindelsesstandarder bliver forældede, DNA vil aldrig, i hvert fald så længe der er liv.

Ideen om at gemme digitale data i DNA er flere årtier gammel, men nyligt arbejde fra Harvard og European Bioinformatics Institute viste, at fremskridt inden for moderne DNA-manipulationsmetoder kunne gøre det både muligt og praktisk i dag. Mange forskningsgrupper, herunder på ETH Zürich, University of Illinois i Urbana-Champaign og Columbia University arbejder på dette problem. Vores egen gruppe ved University of Washington og Microsoft har verdensrekorden for mængden af ​​data, der med succes er lagret i og hentet fra DNA – 200 megabyte.

Forbereder bits til at blive atomer

Traditionelle medier som harddiske, tommelfingerdrev eller dvd'er gemmer digitale data ved at ændre enten den magnetiske, elektriske eller optiske egenskaber af et materiale til at lagre 0'er og 1'ere.

For at gemme data i DNA, konceptet er det samme, men processen er anderledes. DNA-molekyler er lange sekvenser af mindre molekyler, kaldet nukleotider - adenin, cytosin, thymin og guanin, normalt betegnet som A, C, T og G. I stedet for at skabe sekvenser af 0'ere og 1'ere, som i elektroniske medier, DNA-lagring bruger sekvenser af nukleotiderne.

Der er flere måder at gøre dette på, men den generelle idé er at tildele digitale datamønstre til DNA-nukleotider. For eksempel, 00 kunne svare til A, 01 til C, 10 til T og 11 til G. For at gemme et billede, for eksempel, vi starter med dens kodning som en digital fil, som en JPEG. Den fil er, i det væsentlige, en lang række af 0'ere og 1'ere. Lad os sige, at de første otte bits af filen er 01111000; vi deler dem op i par – 01 11 10 00 – som svarer til C-G-T-A. Det er den rækkefølge, vi forbinder nukleotiderne i for at danne en DNA-streng.

Digitale computerfiler kan være ret store – endda terabyte store for store databaser. Men individuelle DNA-strenge skal være meget kortere - kun indeholde omkring 20 bytes hver. Det er fordi, jo længere en DNA-streng er, jo sværere er det at bygge kemisk.

Så vi er nødt til at opdele dataene i mindre bidder, og tilføj hver en indikator for, hvor i rækkefølgen den falder. Når det er tid til at læse den DNA-lagrede information, denne indikator vil sikre, at alle bidder af data forbliver i deres rette rækkefølge.

Nu har vi en plan for, hvordan dataene skal opbevares. Dernæst skal vi faktisk gøre det.

Lagring af data

Efter at have bestemt, hvilken rækkefølge bogstaverne skal gå i, DNA-sekvenserne fremstilles bogstav for bogstav med kemiske reaktioner. Disse reaktioner er drevet af udstyr, der optager flasker med A'er, C'er, G'er og T'er og blander dem i en flydende opløsning med andre kemikalier for at kontrollere de reaktioner, der specificerer rækkefølgen af ​​de fysiske DNA-strenge.

Denne proces giver os en anden fordel ved DNA-lagring:sikkerhedskopier. I stedet for at lave en tråd ad gangen, de kemiske reaktioner laver mange identiske tråde på én gang, før du fortsætter med at lave mange kopier af den næste tråd i serien.

Når først DNA-strengene er skabt, vi skal beskytte dem mod skader fra fugt og lys. Så vi tørrer dem ud og putter dem i en beholder, der holder dem kolde og blokerer for vand og lys.

Men lagrede data er kun nyttige, hvis vi kan hente dem senere.

Læser data tilbage

For at læse data tilbage fra lageret, vi bruger en sekventeringsmaskine nøjagtigt som dem, der bruges til analyse af genomisk DNA i celler. Dette identificerer molekylerne, generere en bogstavsekvens pr. molekyle, som vi så afkoder til en binær sekvens af 0'er og 1'er i rækkefølge. Denne proces kan ødelægge DNA'et, mens det læses - men det er her disse sikkerhedskopier kommer i spil:Der er mange kopier af hver sekvens.

Og hvis sikkerhedskopierne bliver opbrugt, det er nemt at lave duplikerede kopier for at fylde lageret op igen – ligesom naturen kopierer DNA hele tiden.

I øjeblikket, de fleste DNA-genfindingssystemer kræver læsning af al information, der er gemt i en bestemt beholder, selvom vi kun ønsker en lille mængde af det. Det er som at læse en hel harddisks information, bare for at finde en e-mail-meddelelse. Vi har udviklet teknikker – baseret på velundersøgte biokemiske metoder – som lader os identificere og kun læse de specifikke informationer, som en bruger skal hente fra DNA-lagring.

Resterende udfordringer

På nuværende tidspunkt DNA-lagring er eksperimentel. Før det bliver almindeligt, det skal være fuldstændig automatiseret, og processerne med både at bygge DNA og læse det skal forbedres. De er begge tilbøjelige til at fejle og relativt langsomme. For eksempel, nutidens DNA-syntese lader os skrive et par hundrede bytes i sekundet; en moderne harddisk kan skrive hundredvis af millioner bytes i sekundet. Et gennemsnitligt iPhone-billede ville tage flere timer at gemme i DNA, selvom det tager mindre end et sekund at gemme på telefonen eller overføre til en computer.

Det er væsentlige udfordringer, men vi er optimistiske, fordi alle de relevante teknologier forbedres hurtigt. Yderligere, Lagring af DNA-data behøver ikke den perfekte nøjagtighed, som biologi kræver, så forskere vil sandsynligvis finde endnu billigere og hurtigere måder at gemme information på i naturens ældste datalagringssystem.

Denne artikel blev oprindeligt publiceret på The Conversation. Læs den originale artikel.

Varme artikler