Undersøgelse viser en ny gentagelsesbaseret metode, der efterligner Kolmogorov-Smirnov-testen

Gentagelsesplottet er et vigtigt værktøj til at analysere ikke-lineære dynamiske systemer, især systemer, der involverer empirisk observerede tidsseriedata. RP'er viser mønstre i et faserumssystem og angiver, hvor data besøger de samme koordinater. RP'er kan også efterligne nogle typer inferentielle statistikker og lineære analyser, såsom spektralanalyse. Et nyt papir i journalen Kaos , giver et proof of concept for at bruge RP'er til at efterligne Kolmogorov-Smirnov testen, som videnskabsmænd bruger til at afgøre, om to datasæt adskiller sig væsentligt.

Forfatterne, imidlertid, Vær opmærksom på, at ikke alle typer data kan bruges med denne nye metode. "Kontinuerlige data på et interval- eller forholdsskalaniveau ville være bedst egnet til denne teknik, sagde Giuseppe Leonardi, en af undersøgelsens forfattere. "Imidlertid, diskret distribuerede data på samme måleniveau såsom terningkast ville også være velegnede."

Forskerne analyserede gentagelsespunkter i RP'erne ved at opdele RP i fire kvadranter og tælle antallet af gentagelsespunkter i hver celle. Derefter, de beregnede gentagelseshyppigheden inden for stikprøven og mellem stikprøven og brugte disse værdier, sammen med forventede frekvenser, at bestemme en p-værdi relateret til forskellen mellem prøverne. Denne p-værdi indikerede, om de to grupper var fra samme prøve eller fra forskellige prøver.

For at verificere deres proof of concept, forskerne gennemførte en række simuleringer for at se, hvordan deres gentagelsesbaserede test klarede sig sammenlignet med Kolmogorov-Smirnov-testen. Disse simuleringer involverede to grupper af normale, skæv normal, eller log-normalfordelinger med forskellige kombinationer af middelværdier og standardafvigelser. Forskerne fandt ud af, at den gentagelsesbaserede metode virkede nogenlunde det samme som Kolmogorov-Smirnov-testen med nogle få forskelle i følsomhed med forskellige distributionstyper.

Den gentagelsesbaserede test så ud til at være mere følsom ved fordelingens hale end Kolmogorov-Smirnov-testen. Dette kan skyldes, at testen tager højde for afvigelser langs hele rækken af værdier, i modsætning til Kolmogorov-Smirnov testen, som kun tegner sig for den største afvigelse mellem to fordelinger. Leonardi forklarede, at denne øgede følsomhed ville gøre den gentagelsesbaserede test særlig nyttig for ikke-lineære data som menneskelige reaktionstider.

Han advarede også om, at deres metode kunne foreslå statistisk pålidelige forskelle, der er for små til at være meningsfulde. "Dette kan være en ulempe ved testen for praktiske brugere, " sagde Leonardi. "Men, vi har ikke undersøgt sådanne effekter i dybden."

Dette proof of concept demonstrerer, at RP kan være nyttig til statistiske analyseværktøjer. Fremadrettet, holdet planlægger at undersøge virkningerne af stikprøvestørrelse på deres metode. Leonardi sagde, at de også gerne vil videreudvikle testen til at modellere andre typer af konklusioner, herunder variansanalyse.

Sidste artikelLængesigtet henfald af Higgs boson observeret

Næste artikelElektrisk polarisering i den makroskopiske verden og elektroner, der bevæger sig på atomare skalaer