Kredit:Jean-Gabriel Young
To familiemedlemmer tester positive for COVID-19 – hvordan ved vi, hvem der har smittet hvem? I en perfekt verden, netværksvidenskab kunne give et sandsynligt svar på sådanne spørgsmål. Det kunne også fortælle arkæologer, hvordan et skår af græsk keramik kom til at blive fundet i Egypten, eller hjælpe evolutionære biologer med at forstå, hvordan en forlængst uddød forfader metaboliserede proteiner.
Som verden er, videnskabsmænd har sjældent de historiske data, de har brug for, for at se præcis, hvordan noder i et netværk blev forbundet. Men et nyt blad udgivet i Fysisk gennemgangsbreve giver håb om at rekonstruere den manglende information, ved hjælp af en ny metode til at evaluere de regler, der genererer netværksmodeller.
"Netværksmodeller er som impressionistiske billeder af dataene, " siger fysiker George Cantwell, en af undersøgelsens forfattere og en postdoc-forsker ved Santa Fe Institute. "Og der har været en række debatter om, hvorvidt de rigtige netværk ligner disse modeller nok til, at modellerne er gode eller nyttige."
Normalt når forskere forsøger at modellere et voksende netværk - siger, en gruppe individer, der er inficeret med en virus - de bygger modelnetværket op fra bunden, følge et sæt matematiske instruktioner for at tilføje et par noder ad gangen. Hver knude kunne repræsentere et inficeret individ, og hver kant en forbindelse mellem disse individer. Når klyngerne af noder i modellen ligner de data, der er hentet fra de virkelige tilfælde, modellen anses for at være repræsentativ - en problematisk antagelse, når det samme mønster kan være resultatet af forskellige sæt instruktioner.
Cantwell og medforfatterne Guillaume St-Onge (University Laval, Quebec) og Jean-Gabriel Young (University of Vermont) ønskede at bringe et skud statistisk stringens til modelleringsprocessen. I stedet for at sammenligne funktioner fra et øjebliksbillede af netværksmodellen med funktionerne fra data fra den virkelige verden, de udviklede metoder til at beregne sandsynligheden for hver mulig historie for et voksende netværk. Givet konkurrerende regelsæt, som kunne repræsentere processer i den virkelige verden, såsom kontakt, dråbe, eller luftbåren transmission, forfatterne kan anvende deres nye værktøj til at bestemme sandsynligheden for, at specifikke regler resulterer i det observerede mønster.
"I stedet for bare at spørge 'ligner dette billede mere den ægte vare?'" siger Cantwell, "Vi kan nu stille materielle spørgsmål som, 'voksede det efter disse regler?'" Når den mest sandsynlige netværksmodel er fundet, den kan spole tilbage for at besvare spørgsmål som f.eks. hvem der blev smittet først.
I deres nuværende papir, forfatterne demonstrerer deres algoritme på tre simple netværk, der svarer til tidligere dokumenterede datasæt med kendte historier. De arbejder nu på at anvende værktøjet til mere komplicerede netværk, som kunne finde applikationer på tværs af et vilkårligt antal komplekse systemer.