Efterforskere, der forsøger at identificere en ukendt person, kan bruge måneder på at finkæmme massive stamtræer. Kredit:Cory Hall
I næsten 37 år var hun kendt som Buckskin Girl - et ungt, anonymt mordoffer fundet uden for Dayton, Ohio, iført en hjorteskindsponcho. Så i april 2018 meddelte politiet, at mysteriet om hendes identitet var blevet løst. Hendes navn var Marcia L. King, og hun var blevet identificeret ved at knytte et udsnit af hendes DNA til en af hendes fætre.
Det var en af de første højprofilerede sager, hvor denne efterforskningsmetode var blevet brugt til at identificere et uanmeldt lig. To uger efter at Kings navn blev afsløret, meddelte politiet i Californien, at de havde brugt lignende teknikker til at opspore Golden State-morderen. Pludselig blev kombinationen af genetisk prøveudtagning, slægtsforskning og gammeldags gumshoeing hyldet som et revolutionært gennembrud, der ville knække hundredvis af forkølelsessager.
Siden da har retsgenetisk genealogi ryddet mere end 400 sager i USA. Alligevel er dette detektivarbejde komplekst og tidskrævende. Mens King blev identificeret efter blot et par timers efterforskning, tager de fleste sager meget længere tid. I gennemsnit tager de over et år at løse med succes. Mange er efterladt ufærdige:Retshåndhævende myndigheder løber måske tør for finansiering, før en person kan identificeres, og efterforskere kan give op, hvis de rammer for mange blindgyder.
En mere systematisk tilgang ville hjælpe, siger Lawrence Wein, professor i drift, information og teknologi ved Stanford Graduate School of Business. Med Mine Su Ertürk, Ph.D., har han løftet sløret for en metode til at løse kolde tilfælde med mere hurtighed og succes. I en ny artikel i Journal of Forensic Sciences , præsenterer de den første detaljerede matematiske analyse af den retsgenetiske genealogiproces og skitserer en måde, hvorpå efterforskere kan optimere søgninger efter ukendte ofre eller mistænkte for kriminelle.
For at udvikle deres søgemetode gik Wein og Ertürk sammen med DNA Doe Project, en nonprofitorganisation i Californien, der har løst mere end 65 tilfælde af uidentificerede rester, inklusive King-sagen. Det gav forskerne data fra 17 sager, herunder 8, der var uløste på det tidspunkt. "Det svarer ret meget til det historiske gennemsnit af sager, de har løst," siger Wein. "Så der er ingen grund til at antage, at disse sager er meget sværere eller meget nemmere end tilfældigt udvalgte sager."
Ved at bruge disse data fra den virkelige verden undersøgte Wein og Ertürk, hvordan retsgenetiske slægtsforskning almindeligvis udføres, og testede derefter deres metode, som har til formål at maksimere sandsynligheden for at finde en løsning på kortest mulig tid. "Det viser sig at være meget hurtigere," siger Wein om den nye tilgang - næsten 10 gange hurtigere. "Hvis de kun løser et lille antal sager ved hjælp af den nuværende metode, og vi kan få dem til at løse dem 10 gange hurtigere, så kan de løse mange flere sager."
En skov af stamtræer
En typisk genetisk slægtsforskning begynder med en DNA-prøve fra et "mål", såsom et uidentificeret lig eller en mordmistænkt. Det uploades til en DNA-database såsom GEDmatch eller FamilyTreeDNA, som genererer en liste over "matches" - mennesker, der deler dele af målets genom. En søgning kan finde hundredvis af disse kampe, normalt fjerne fætre, hvis fælles forfædre kan være døde for mere end et århundrede siden. De tilfælde, Wein og Ertürk analyserede, havde mellem 200 og 5.000 kampe.
Det er kun begyndelsen:At trække en linje fra disse fjerntliggende slægtninge til målet kræver opbygning af et stamtræ, der omfatter så mange familiemedlemmer som muligt. Også her er problemets omfang skræmmende. "Det er enorme træer," siger Wein. "Det er virkelig svært visuelt at placere noget større end et par dusin mennesker." Efterhånden som træet udvides, forbedres oddsene for at identificere målet – men længden af søgningen øges også.
Dernæst skal de relevante personer i træet identificeres. Dette kræver gennemsøgning af offentlige registre, slægtsforskningswebsteder og sociale medier - tidskrævende benarbejde, der kombinerer intuition og dygtighed. "Der er en hel kunst i det," siger Wein. "Brug af ægteskabsdokumenter og dødsdokumenter og fødselsdokumenter og Facebook og alle mulige forskellige optegnelser for at prøve at finde ud af, hvem mennesker er, og hvem deres forfædre og afkom er."
Det er ikke umiddelbart indlysende, hvilke kampe der vil give den bedste vej til målet. Efterforskernes strategier til at følge disse spor har en tendens til at være decentraliserede, siger Wein. "Du har et hold af mennesker, der gør dette, og de vil hver især beslutte sig for at tage en kamp for at undersøge, og så går de af sted på egen hånd for at prøve at bygge et stamtræ bagud i tiden fra hver kamp. De tænker ikke om det store billede holistisk."
Ved at træde tilbage og vurdere hele problemet giver Wein og Ertürk en køreplan for genetiske slægtsforskere, der søger den mest effektive vej til et uidentificeret mål. "Dybest set fortæller vi dem:"I betragtning af, hvor du er i søgningen lige nu, er det, hvad du skal gøre næste gang," siger Wein.
Løsning af ligninger og forbrydelser
At forklare forskellen mellem den nye søgemetode og standard- eller "benchmark"-metoden er kompliceret, men Wein koger det ned til dette:"Benchmarkmetoden leder efter fælles forfædre mellem forskellige matches. Det, du virkelig vil finde, er det mest nylig fælles forfader mellem en match og det ukendte mål, og det er et lidt andet problem." Den seneste fælles forfader til første fætre, for eksempel, er en bedsteforælder; anden fætre deler en oldeforælder, og så videre.
Efter at have identificeret en liste over mulige seneste fælles forfædre, udfylder Wein og Ertürks metode "aggressivt" stamtræet med deres efterkommere, selvom der kun er en lille chance for, at målets forfader er på listen.
Dette spring opnås ved at bruge sandsynlighedsteori til at spore søgningens fremskridt. "Vi gør dette ved at beskrive det rekonstruerede stamtræ som en samling af sandsynligheder, der repræsenterer, hvor sandsynligt hver person på vores træ er for at være en korrekt forfader til målet," forklarer Ertürk. "Så ser du på disse sandsynligheder, kan du fortælle, hvilke dele af træet du bør udforske mere."
Denne tilgang viser sig effektiv selv med mindre stamtræer, hvilket betyder hurtigere løsningstider. Efter at have kørt hundredvis af simulerede søgninger konkluderer Wein og Ertürk, at deres metode kan løse en sag med et 7.500-personers stamtræ omkring 94 % af tiden. Standardmetodens succesrate i disse tilfælde er omkring 4%.
Wein håber, at disse resultater vil hjælpe DNA Doe Project og andre efterforskere med at forfine deres tilgang og knække flere sager. Han bemærker, at hans analyse ikke tager højde for nogle af de "tricks", genetiske efterforskere bruger til at indsnævre deres søgninger, såsom at fokusere på familiemedlemmer, der boede et bestemt sted. "Det er på ingen måde meningen, at vores algoritme skal erstatte slægtsforskere," siger han. "Men hvis de virkelig sidder fast, vil det give dem nogle ideer, som måske ikke er indlysende."
Wein og Ertürk har tidligere anvendt matematik til at tackle efterforskningsmæssige udfordringer. Sidste år skrev Ertürk et papir sammen med Stanford GSB-professor Kuang Xu, der skitserede en metode til genetisk søgning, der balancerer effektivitet og privatliv. Wein har forsket i bedre måder at scanne fingeraftryk, behandle kits til seksuelle overgreb og spore kugler.
Han ser retsgenetisk genealogi som et andet kriminalitetsløsende værktøj, der kan forbedres, så det kan leve op til dets løfte. "Det er et interessant felt, der kombinerer sandsynlighed og statistik og optimering og nogle gange spilteori," siger han. "Sådan forblev jeg, fra et matematisk synspunkt, tiltrukket af disse problemer." + Udforsk yderligere