Kredit:CC0 Public Domain
De fleste af os kender kun alt for godt dette fænomen:når det er varmt udenfor, du føler trang til en kølende is. Men ville du have troet, at matematik kunne være involveret?
Lad os forklare:De stigende temperaturer og stigende isforbrug er to statistiske variable i lineær afhængighed; de er korrelerede.
I statistik, korrelationer er vigtige for at forudsige variables fremtidige adfærd. Sådanne videnskabelige prognoser efterspørges ofte af medierne, det være sig til fodbold eller valgresultater.
For at måle lineær afhængighed, forskere bruger den såkaldte korrelationskoefficient, som først blev introduceret af den britiske naturvidenskabsmand Sir Francis Galton (1822-1911) i 1870'erne. Kort efter, matematikeren Karl Pearson gav en formel matematisk begrundelse for korrelationskoefficienten. Derfor, matematikere taler også om "Pearson-produkt-øjeblikskorrelationen" eller "Pearson-korrelationen".
Hvis, imidlertid, afhængigheden mellem variablerne er ikke-lineær, korrelationskoefficienten er ikke længere et passende mål for deres afhængighed.
René Schilling, Professor i sandsynlighed ved TU Dresden, understreger "Hidtil har det har krævet en stor beregningsmæssig indsats at opdage afhængigheder mellem mere end to højdimensionelle variable, især når komplicerede ikke-lineære sammenhænge er involveret. Vi har nu fundet en effektiv og praktisk løsning på dette problem."
Dr. Björn Böttcher, Prof. Martin Keller-Ressel og prof. René Schilling fra TU Dresdens Institut for Matematisk Stokastik har udviklet et afhængighedsmål kaldet "distance multivariance". Definitionen af denne nye målestok og den underliggende matematiske teori blev offentliggjort i det førende internationale tidsskrift Annals of Statistics under titlen "Distance Multivariance:New
Afhængighedsmål for tilfældige vektorer."
Martin Keller-Ressel forklarer:"For at beregne afhængighedsmålet, ikke kun værdierne af de observerede variabler selv, men også deres indbyrdes afstande registreres og fra disse afstandsmatricer, afstanden multivarians beregnes. Dette mellemtrin giver mulighed for påvisning af komplekse afhængigheder, som den sædvanlige korrelationskoefficient simpelthen ville ignorere. Vores metode kan anvendes på spørgsmål inden for bioinformatik, hvor store datasæt skal analyseres."
I en opfølgende undersøgelse, det blev vist, at den klassiske korrelationskoefficient og andre kendte afhængighedsmål kan genvindes som grænsetilfælde fra afstandsmultivariansen.
Björn Böttcher afslutter med at påpege:"Vi leverer alle nødvendige funktioner i pakken 'multivians' til den gratis statistiksoftware R, så alle interesserede parter kan teste anvendelsen af den nye afhængighedsforanstaltning."