Videnskab
 science >> Videnskab >  >> Natur

Forbedring af forbindelser til rumlig analyse

Forskerne demonstrerede nytten af ​​deres faktor copula-model ved at anvende den til analysen af ​​daglige middeltemperaturer i hele Schweiz. Alistair Scott. Kredit:Alamy lagerbillede

En statistisk model, der tager højde for almindelige afhængigheder i rumlige data, giver mere realistiske resultater for undersøgelser af temperatur, vind- og forureningsniveauer.

En statistisk model for rumlige data, temperaturer på forskellige steder, som mere nøjagtigt repræsenterer den geografiske sammenhæng mellem målte variabler er udviklet af Saudi-Arabiens King Abdullah University of Science and Technology (KAUST) forskere.

Robuste og realistiske statistiske modeller er kritiske for næsten alle områder inden for videnskabelig forskning og teknik. At vælge den forkerte statistiske model for et givet datasæt kan føre til en potentielt katastrofal fejlfortolkning af resultater, mens en model, der redegør for det mekanistiske forhold mellem variabler, kan føre til ny indsigt og opdagelser.

"Spatial statistik involverer modellering af variabler målt på forskellige rumlige steder, " sagde Marc Genton, Professor i anvendt matematik og beregningsvidenskab ved KAUST. "Mange eksisterende modeller, kaldet copulas, kan ikke korrekt fange den rumlige afhængighed mellem variabler, som når afhængigheden mellem variabler bliver svagere med stigende afstand - som det er tilfældet med temperatur."

Genton, med sine kolleger Dr. Pavel Krupskii og professor Raphaël Huser, designet en kopula, der kan håndtere forskellige typer af afhængigheder blandt variabler. Deres model tilbyder også en enklere fortolkning af dataene sammenlignet med andre modeller:denne fortolkning, enkelt sagt, siger, at der eksisterer en uobserveret fælles faktor, der påvirker alle variablerne samtidigt.

"For eksempel, temperaturdata i et lille geografisk område kan være underlagt almindelige vejrforhold, som kan opfattes som en fælles faktor, " forklarede Genton. "For at repræsentere sådanne situationer, vi har brugt en standard gaussisk model og tilføjet en fælles tilfældig faktor, der påvirker alle variablerne samtidigt, hvilket er en plausibel antagelse i mange rumlige applikationer."

En Gaussisk model er en af ​​de mest fundamentale og alsidige statistiske modeller. Det bruges til at beskrive en tilfældig fordeling af værdier omkring en gennemsnitsværdi svarende til den klassiske klokkekurve, hvor de fleste målte værdier forekommer nær gennemsnittet med to haler på hver side. Disse haler repræsenterer den stigende sjældenhed af væsentligt højere eller lavere værdier fra gennemsnittet. Den Gaussiske model er særlig kraftfuld i Gentons faktor-baserede kopula, fordi den giver mulighed for naturlig integration af en fælles faktor afhængighed blandt variabler.

Forskerne demonstrerede nytten af ​​deres faktor copula-model ved at anvende den til analysen af ​​daglige middeltemperaturer i hele Schweiz. Deres model klarede sig godt sammenlignet med andre statistiske tilgange og gav en mere robust repræsentation af den underliggende afhængighed mellem geografiske lokationer.

Ser frem til, Genton forklarede, "Vores kopula kan bruges til at modellere enhver variabel målt gentagne gange i tid på forskellige rumlige steder, såsom daglige eller timelige temperatur- eller vinddata ved forskellige vejrstationer, eller at modellere forureningsniveauer målt ved hjælp af vejrballoner eller satellitter."


Varme artikler