Gamze Gursoy, Ph.D., Yale Universitet. Kredit:Gamze Gursoy
Baseret på en analyse af datalækager og muligheder for at forhindre potentielt misbrug af genetisk information, forskere har udviklet et nyt filformat til funktionel genomik-data, der muliggør datadeling og samtidig beskytter forskningsdeltagernes personlige oplysninger. Resultaterne blev præsenteret på American Society of Human Genetics (ASHG) 2018 årsmøde i San Diego, Californien
Funktionel genomik er studiet af, hvordan genomet fungerer i kroppen, såsom hvordan gener reguleres, udtrykkes i proteiner, og interagerer med proteiner for at påvirke cellulære funktioner i sygdom og sundhed. Gamze Gursoy, Ph.D., postdoktoral forskningsassistent ved Yale University Computational Biology and Bioinformatics Program, og hendes kolleger satte sig for at identificere svagheder i nuværende funktionelle genomics datafiler og processer og finde praktiske rettelser.
"Da funktionel genomikteknologi stadig dukker op, dataene fra denne forskning ikke er blevet godt undersøgt af privatlivsforskere, " sagde Dr. Gursoy. Tidligere analyser har vist, at i visse tilfælde, det er muligt at spore afidentificerede funktionelle genomiske data tilbage til den enkelte deltager, et koncept kendt som datalækage. Gennem en række tests i de sidste par år, Dr. Gursoy og hendes kolleger målte mængden af variantinformation lækket i genekspression og funktionelle genomiske eksperimenter, der involverede forskellige datatyper, og i hvilket omfang disse oplysninger kunne kortlægges tilbage til enkeltpersoner.
"Ligesom genetiske data, disse data kommer fra rigtige individer, og vi ønskede at skabe opmærksomhed om, at der kunne være lækager. På samme tid, vi ønsker at demokratisere adgangen til data og undgå bureaukratiske forhindringer, " sagde hun. For at nå dette mål, forskerne udviklede måder til at måle lækage fra rå funktionelle genomiske data og et filformat for at reducere lækagen på en målrettet måde.
Især formatet, de udviklede, er let lagt på genetiske datafiltyper, der allerede er i almindelig brug, såsom sekvensjusteringsmapping og binær alignmentmapping. Dr. Gursoy håber, at dens brugervenlighed tilskynder flere forskere til at gøre deres resultater tilgængelige gennem de rigtige kanaler.
"Vi ønsker at balancere deltagernes privatliv med strøm af videnskabelig information, "sagde Dr. Gursoy." Hvis forskere begrænser deres data fuldstændigt, den videnskabelige opdagelse stopper."
Dr. Gursoy arbejder nu med eksisterende datalagre, såsom ENCODE. Hun understregede, at beskyttelse af privatlivets fred er en kontinuerlig indsats, der ikke stopper med dette ene filformat; det handler også om at uddanne offentligheden.
"Genomisk privatliv er meget unikt, " sagde Dr. Gursoy. "Genetiske data kan bruges til at knytte folk til deres sygdomsstatus i visse databaser. Mens der er love på plads som loven om ikke-diskriminering af genetisk information, folk er uvidende om, at forsikringsselskaber ikke kan bruge dine genetiske oplysninger til at afvise dækning."
Dr. Gursoy håber, at denne filtype vil blive udbredt, fører til mere samarbejde på området og færre forhindringer for at reproducere forskning. Hun fortsætter med at arbejde med metoder til at levere forskningsdata rettidigt og samtidig holde informationen sikker.