I ovenstående 6, 000 personers stamtræ renset og organiseret ved hjælp af grafteori, individer, der spænder over syv generationer, er repræsenteret i grønt, med deres ægteskabelige forbindelser i rødt. Kredit:Columbia University
Thanksgiving -sammenkomster kunne blive større - meget større - efterhånden som videnskaben afdækker de familiære bånd, der binder os. Fra millioner af indbyrdes forbundne online slægtsforskningsprofiler, forskere har samlet de største, videnskabeligt undersøgt stamtræ til dato, som på 13 millioner mennesker, er lidt større end en nation på størrelse med Cuba eller Belgien. Udgivet i tidsskriftet Videnskab , det nye datasæt giver frisk indsigt i de sidste 500 års ægteskab og migration i Europa og Nordamerika, og genernes rolle i levetiden.
"Gennem hårdt arbejde fra mange slægtsforskere, der er nysgerrige efter deres familiehistorie, vi crowdsourcede et enormt stamtræ og boom, fandt på noget unikt, " sagde undersøgelsens seniorforfatter, Yaniv Erlich, en datalog ved Columbia University og Chief Science Officer hos MyHeritage, et slægts- og DNA -testfirma, der ejer Geni.com, platformen, der er vært for de data, der er brugt i undersøgelsen. "Vi håber, at dette datasæt kan være nyttigt for forskere, der forsker i en række andre emner."
Forskerne downloadede 86 millioner offentlige profiler fra Geni.com, en af verdens største samarbejdswebsteder for slægtsforskning, og brugt matematisk grafteori til at rense og organisere dataene. Det, der dukkede op blandt andre mindre stamtræer, var et enkelt træ på 13 millioner mennesker, der i gennemsnit spændte over 11 generationer. Teoretisk set, de skulle gå 65 år tilbage for at konvergere til en fælles forfader og fuldføre træet. Stadig, datasættet repræsenterer en milepæl ved at flytte familiehistoriske søgninger fra avisers nekrologer og kirkearkiver ind i den digitale æra, muliggør undersøgelser på befolkningsniveau. Forskerne gør det også nemt at overlejre andre datasæt for at studere en række socioøkonomiske tendenser i stor skala.
"Det er et spændende øjeblik for borgervidenskab, " sagde Melinda Mills, en demograf ved University of Oxford, som ikke var involveret i undersøgelsen "Det viser, hvordan millioner af almindelige mennesker i form af slægtsforskningsentusiaster kan gøre en forskel for videnskaben. Magt til folket!"
Datasættet beskriver, hvornår og hvor hver enkelt person blev født og døde, og afspejler demografien af Geni.com -enkeltpersoner, med 85 procent af profilerne, der stammer fra Europa og Nordamerika. Forskerne bekræftede, at datasættet var repræsentativt for den generelle amerikanske befolknings uddannelsesniveau ved at krydstjekke en undergruppe af Vermont Geni.com-profiler mod statens detaljerede dødsregister.
"De rekonstruerede stamtavler viser, at vi alle er i familie med hinanden, sagde Peter Visscher, en kvantitativ genetiker ved University of Queensland, som ikke var involveret i undersøgelsen. "Dette faktum er kendt fra grundlæggende befolkningshistoriske principper, men det, forfatterne har opnået, er stadig meget imponerende. "
Ægteskab, Migration og genetiske relationer Industrialiseringen ændrede arbejds- og familieliv dybt, og disse tendenser falder sammen med skiftende ægteskabsvalg i dataene. Før 1750, de fleste amerikanere fandt en ægtefælle inden for 10 kilometer fra, hvor de blev født, men for dem født i 1950, denne afstand havde strakt sig til omkring 60 miles (100 kilometer), fandt forskerne. "Det blev sværere at finde dit livs kærlighed, " Erlich joker.
Før 1850, gifte sig i familien var almindeligt - for en der var, gennemsnitlig, en fjerde fætter, sammenlignet med syvende kusiner i dag, fandt forskerne. Mærkeligt nok, forskerne fandt, at mellem 1800 og 1850, folk rejste længere end nogensinde for at finde en ægtefælle - næsten 19 kilometer i gennemsnit - men var mere tilbøjelige til at gifte sig med en fjerde fætter eller tættere på. Ændring af sociale normer, snarere end stigende mobilitet, kan have fået folk til at undgå nære pårørende som ægtefæller, antager de.
I en beslægtet observation, de fandt ud af, at kvinder i Europa og Nordamerika er migreret mere end mænd i løbet af de sidste 300 år, men da mænd migrerede, de rejste betydeligt længere i gennemsnit.
Gener og lang levetid For at prøve at løse naturens og nærings rolle i lang levetid, forskerne byggede en model og trænede den på et datasæt med 3 millioner slægtninge født mellem 1600 og 1910, der havde levet over 30 år. De udelukkede tvillinger, personer, der døde i den amerikanske borgerkrig, Første og anden verdenskrig, eller i en naturkatastrofe (udledes, hvis pårørende døde inden for 10 dage efter hinanden).
De sammenlignede hvert individs levetid med deres slægtninge og deres grad af adskillelse og fandt ud af, at gener forklarede omkring 16 procent af levetidsvariationen set i deres data – i den lave ende af tidligere skøn, som har varieret fra omkring 15 procent til 30 procent.
Resultaterne indikerer, at gener med god levetid kan forlænge en persons liv med i gennemsnit fem år, sagde Erlich. "Det er ikke meget, "tilføjer han." Tidligere undersøgelser har vist, at rygning tager 10 år fri af dit liv. Det betyder, at nogle livsvalg kan betyde meget mere end genetik."
Væsentligt, undersøgelsen viser også, at de gener, der påvirker levetiden, virker uafhængigt i stedet for at interagere med hinanden, et fænomen kaldet epistase. Nogle forskere har brugt epistase til at forklare, hvorfor store genomiske undersøgelser hidtil ikke har fundet de gener, der koder for komplekse træk som intelligens eller levetid.
Hvis nogle genetiske varianter virker sammen for at påvirke levetiden, forskerne ville have set en større sammenhæng blandt nært beslægtede individer, der deler mere DNA, og dermed flere genetiske interaktioner. Imidlertid, de fandt en lineær sammenhæng mellem lang levetid og genetisk slægtskab, udelukker udbredt epistase.
"Dette er vigtigt i feltet, fordi epistase er blevet foreslået som en kilde til 'manglende arvelighed', "sagde undersøgelsens hovedforfatter, Joanna Thornycroft, en tidligere kandidatstuderende ved Whitehead Institute for Biomedical Research, nu på Wellcome Sanger Institute.
Tilføjer Visscher:"Dette er helt i tråd med teori og tidligere konklusioner fra SNP [variant] data, men af en eller anden grund tror mange forskere inden for menneskelig genetik og epidemiologi fortsat, at der er en masse ikke-additiv genetisk variation for almindelige sygdomme og kvantitative egenskaber. "
Datasættet er tilgængeligt for akademisk forskning via FamiLinx.org, en hjemmeside lavet af Erlich og hans kolleger. Selvom FamiLinx -data er anonymiseret, nysgerrige læsere kan tjekke Geni.com for at se, om et familiemedlem kan have tilføjet dem der. Hvis så, der er en god chance for, at de kan være kommet ind i det 13 millioner personer store stamtræ.
Ud over sin stilling hos MyHeritage, en virksomhed, der giver forbrugerne mulighed for at opdage deres familiehistorie gennem genetiske tests og dets genealogiske platform, Erlich er professor i datalogi ved Columbia Engineering, medlem af Columbia's Data Science Institute, og et supplerende kernemedlem af New York Genome Center (NYGC).
Andre undersøgelsesforfattere er Assaf Gordon, fra NYGC og Whitehead Institute; Tal Shor, af MyHeritage og Technion; Omer Weissbrod fra Israels Weizmann Institute of Science; Dan Geiger fra Technion; Mary Wahl fra Whitehead Institute, NYGC og Harvard; Michael Gershovits, Barak Markus og Mona Sheikh fra Whitehead Institute; Melissa Gymrek fra University of California i San Diego; og Gaurav Bhatia, Daniel MacArthur og Alkes Price fra Harvard og Broad Institute.