Fuld afhængighedsstruktur. Kredit:Björn Böttcher
I december, det akademiske forlag De Gruyter lancerede sit nye tidsskrift Åbn statistik med en åbningsartikel af TU Dresden-matematiker Dr. Björn Böttcher. Artiklen præsenterer udvidelsen af det statistiske mål for afstand multivarians udviklet af Böttcher og hans kolleger ved TU Dresden.
Afstandsmultivarians er et multivariat afhængighedsmål, der kan detektere afhængigheder mellem et vilkårligt antal tilfældige vektorer, som hver kan have en særskilt dimension. I sin nye artikel, Böttcher præsenterer nu konceptet som en samlende teori, der kombinerer flere klassiske afhængighedsmål. Forbindelser mellem to eller flere højdimensionelle variable kan fanges og endda komplicerede ikke-lineære afhængigheder såvel som afhængigheder af højere orden kan detekteres. For adskillige videnskabelige discipliner, denne metode åbner op for nye tilgange til at opdage og evaluere afhængigheder.
Kan antallet af manglende skoledage hænge sammen med alderen, skoleelevers køn eller oprindelse? I en undersøgelse blandt 146 skoleelever, samfundsforskere analyserede forskellige indflydelsesvariabler på manglende skoledage og undersøgte dem for afhængigheder for at udlede en forudsigelsesmodel. Dette klassiske spørgsmål er allerede blevet diskuteret og analyseret bredt med forskellige statistiske tilgange.
Det statistiske mål for afstandsmultivarians præsenterer en ny tilgang til dette spørgsmål:Dr. Björn Böttcher fra Institute of Mathematical Stokastics var i stand til at bruge afstandsmultivarians til at bestemme den kulturelle baggrund og en højere ordens afhængighed, herunder alder og køn som påvirkende faktorer for de savnede skole dage. Han var således i stand til at foreslå en minimal model. "Dette er et elementært eksempel på en anvendelse af den udviklede metode. Jeg kan ikke bedømme, om dette også er en underbygget konklusion med hensyn til det undersøgte spørgsmål. Arbejdet med reelle data og især den fagspecifikke fortolkning af resultaterne kræver altid ekspertise mht. respektive emne, " Dr. Böttcher siger, og giver adskillige andre illustrative eksempler på anvendelsen af hans metode:"I papiret, Jeg henviser til mere end 350 frit tilgængelige datasæt fra alle videnskabelige discipliner, hvor der forekommer statistisk signifikante afhængigheder af højere orden. Igen, hvorvidt disse afhængigheder er meningsfulde i forhold til de underliggende undersøgelser kræver yderligere undersøgelser samt ekspertise på de respektive områder, " og han tilføjer, "selvfølgelig, anmodninger om samarbejde er altid velkomne."
Statistisk analyse overvejer normalt afhængigheder mellem individuelle variabler. Især med mange variabler, det er ønskeligt at fjerne uafhængige variabler, før man studerer specifikke typer af afhængighed. Dr. Björn Böttcher præsenterer en metode til dette formål kaldet "detektion af afhængighedsstruktur, " som også kan bruges til at detektere afhængigheder af højere orden. Variabler kaldes "afhængige af højere orden", hvis de er parvis uafhængige, men mere end to variable påvirker stadig hinanden i fællesskab. Afhængigheder af denne art har hidtil ikke været i fokus for applikationer.
Nogle videnskabsmænd har mistanke om, at afhængigheder af højere orden forekommer i genetik især:Den grundlæggende idé her er, at flere gener sammen bestemmer en egenskab, men disse gener viser hverken individuelt nogen afhængighed indbyrdes eller individuelt med egenskaben - således ville disse faktisk være afhængige af højere orden. Rammerne for afstandsmultivarians og afhængighedsstrukturdetektionsmetoden er nu lovende værktøjer til sådanne undersøgelser.
Implementeringer af de nye metoder er tilvejebragt til direkte applikationer i pakken "multivians" til det frie statistiske computermiljø R.