Videnskab
 science >> Videnskab >  >> Andet

Metode til at visualisere skjulte statistiske strukturer i miljødata

Huang Huang (til venstre) og Ying Sun har udviklet en metode til visualisering af de spatio-tidsmæssige kovariansegenskaber for et datasæt, som vil hjælpe med at give mening om miljødata. Kredit:KAUST

Forudsigelse af klima og vejr afhænger af statistiske modeller, der kan fange variation på et sted over tid såvel som forholdet til andre geografiske steder. Nogle gange kan fremtidige forhold på et sted forudsiges ud fra de aktuelle forhold på et andet sted, mens der i andre tilfælde ikke er nogen sådan sammenhæng. Antagelsen om, hvorvidt to websteder er 'kovariante' på en eller anden måde kan have dybtgående konsekvenser for nøjagtigheden af ​​den statistiske model, og derfor er valget af rum-tid-kovarians afgørende.

Ying Sun og hendes elev Huang Huang fra KAUST har nu udviklet en metode til visualisering af de spatio-temporale kovariansegenskaber for et datasæt, meget at forenkle et vigtigt modelleringstrin, der tidligere krævede omhyggelig sonderende dataanalyse.

"Vi foreslår en let og bekvem måde at visualisere egenskaberne ved kovariansstrukturen i dataene, som hjælper praktiserende læger med at vælge passende statistiske modeller for kovarianser, "siger Sun." Især denne metode er nyttig til data, der observeres sparsomme i rummet og tætte i tiden, hvilket for eksempel ofte er tilfældet for observationer af vejrstationer. "

Sun og Huang betragtede to nøgletyper af kovarians-symmetri og adskillelighed. Symmetri indebærer, at de rumlige-tidsmæssige processer er reversible i tid, mens adskillelighed indikerer, at korrelationen i tiden ikke interagerer med den i rummet.

"Hvis man antager en fuldt symmetrisk eller en adskillelig kovarians, fører det til en meget enklere model og dermed hurtige beregninger, "siger Sun." Dog, denne modelantagelse kan være krænket i mange rigtige applikationer, hvilket fører til mindre præcis estimering og forudsigelse. "

Huang og Sun brugte en funktionel dataanalysetilgang til at konstruere testfunktioner ud fra kovarianserne i tidsseriedata mellem stedspar. Disse testfunktioner opsummerer effektivt egenskaberne ved adskillelse eller symmetri og kan vises som boxplots, der viser graden af ​​ikke-adskillelighed eller asymmetri.

"Vi anvendte denne tilgang til meteorologiske observationer og simulerede vejrdata fra nogle almindeligt anvendte klimamodeller, "siger Huang." I de rapporterede eksempler på et studieområde i det nordlige Atlanterhav, denne metode viste, at vindhastighed og overfladetemperatur har forskellige kovariansstrukturer i forskellige årstider. "

Visualiseringen kan beregnes relativt hurtigt for en håndfuld overvågningsstationer, og forskerne bemærker, at beregningseffektiviteten kan forbedres for større antal stationer ved at opdele problemet i underregioner. Alligevel, metoden giver et værdifuldt værktøj, der i høj grad vil hjælpe praktiserende læger.