Videnskab
 science >> Videnskab >  >> Elektronik

AI-skabte slægtstræer bekræfter inddelinger fra det 18. og 19. århundrede i Finland

En lille del af et slægtstræ, der dækker 13 generationer, der blev afledt af algoritmen. Farverne viser individets socioøkonomiske status. Kredit:Eric Malmi

Det ville tage 100 årsværk for en slægtsforsker at kortlægge og finde alle forældrene til fem millioner mennesker-med en hastighed på en person i minuttet. AncestryAI -algoritmen kan udføre det samme arbejde på en time ved hjælp af 50 parallelle computere og med en succesrate på 65 procent. Algoritmen kan også måle usikkerhedsniveauet for hver forbindelse, så upålidelige resultater kan ignoreres. Slægtsforskere og demografer kan bruge algoritmen til at kaste lys over samfundsmæssige ændringer og historie.

'Algoritmen erstatter ikke slægtsforskers arbejde; det er simpelthen et værktøj til at hjælpe dem i deres arbejde. Slægtsalgoritmen kan foreslå forbindelser, der sandsynligvis er korrekte, men i sig selv er den ikke så præcis som en omhyggelig slægtsforsker. Algoritmen kan også søge efter forældre fra landsdækkende data, mens en slægtsforsker muligvis skal begrænse deres søgning til kun et sogn, 'forklarer Eric Malmi, doktorand ved Aalto University, der i øjeblikket arbejder for Google i Zürich.

Ved hjælp af AncestryAI, lanceret i 2017, slægtsforskere er faktisk lykkedes med at finde nye forfædre, såsom familiære bånd mellem individer, hvoraf nogle har flyttet til forskellige regioner i Finland. I øjeblikket, AncestryAI bruges til at udlede de genealogiske forhold for mennesker, der døde i den finske borgerkrig i 1918, at give, for eksempel, et mere præcist skøn over antallet af krigsforældreløse børn.

Klasseinddeling i Finland forblev uændret i 150 år

Slægtsalgoritmen hjælper med at undersøge enorme mængder data for at analysere sociale ændringer over lange perioder frem for kun på bestemte og snævre tidsrammer. Malmis arbejde har bekræftet, for eksempel, denne klassedeling i Finland forblev praktisk talt uændret mellem 1735 og 1885.

'Vi undersøgte effekten af ​​socioøkonomisk status på valget af ægtefælle og fandt ud af, at de er klart forbundet. Mod vores forventninger, imidlertid, forbindelsens styrke faldt ikke over tid, men snarere forblev den samme, 'forklarer Malmi.

Socioøkonomisk status blev udledt baseret på erhverv som ægtefælles far. Gaardmænd og andre jordløse bønder repræsenterede den laveste klasse, og resten blev derefter opdelt i forpagtere, landmænd, middelklasse og overklasse.

AncestryAI gør brug af statistiske fradrag og maskinlæringsprocedurer udviklet til slægtsforskning. Den grundlæggende algoritme søger separat at udlede mor og far for hver enkelt baseret på deres navn, lokalitet og fødselsdato. En supplerende algoritme forbedrer derefter nøjagtigheden af ​​den grundlæggende algoritme ved at tage hensyn til andre faktorer, sådan som at folk normalt får børn med samme ægtefælle.

AncestryAI gør brug af data i HisKi -databasen, der vedligeholdes af Genealogical Society of Finland. Dataene består af i alt 5 millioner fødsler og 3,3 millioner dødsfald i løbet af 1648–1918. Algoritmen har lavet i alt 7,3 millioner forbindelser mellem børn og deres forældre.


Varme artikler