Videnskab
 science >> Videnskab >  >> Andet

Sådan beregnes ANOVA af Hand

Statistikere og evolutionærbiolog Ronald Fisher udviklede ANOVA, eller variansanalyse, for at være et middel til et mål. Det kan hjælpe dig med at finde ud af, om resultaterne af et eksperiment, en undersøgelse eller en undersøgelse kan understøtte hypotesen. Ved hjælp af ANOVA kan du hurtigt beslutte, om en hypotese er sand eller falsk.
Hvad er ANOVA?

ANOVA bruges til at evaluere afvigelserne mellem gruppemetoder i en prøve. ANOVA er en samling af statistiske modeller og deres relaterede estimeringsprocedurer. Det er dybest set variationen mellem to kendte datagrupper. Det tilbyder en statistisk test af, om populationsmidlet i flere datasæt faktisk er ens. Derefter generaliseres t-testen, eller en analyse af to populationsmidler gennem statistisk undersøgelse, til mere end to grupper. En t-test viser, om der er en signifikant forskel mellem befolkningsgennemsnittet og en antaget værdi. Størrelsen på forskellen i forhold til variationen i eksempeldataene er t-værdien.
One Way or Two Way?

Antallet af uafhængige variabler i analysen af varianstest, som du bruger, bestemmer, om ANOVA er den ene eller den anden. En envejstest har en enkelt uafhængig variabel med to niveauer. En tovejsanalyse af varianstest har to uafhængige variabler. En to-vejs test kan have en række niveauer. Et eksempel på en envejs ville være at sammenligne to mærker af gelé. En tovejs sammenligning af mærker af gelé såvel som kalorier, fedt, sukker eller kulhydratniveauer.

Niveauene inkluderer de forskellige grupper, der alle er i den samme uafhængige variabel. Replikering er, når du gentager testene med flere grupper. En tovejsanalyse af varians med replikation bruger to grupper og individer, der er inden for denne gruppe, der gør flere ting. To-vejs ANOVA-test kan udføres med eller uden replikation.
Sådan gør du ANOVA med hånden.

Der findes statistisk software, der hurtigt og nemt kan beregne ANOVA, men det er en fordel at beregne ANOVA med hånden . Det giver dig mulighed for at forstå de individuelle trin, der er involveret, og hvordan de hver især bidrager til at vise forskellene mellem de flere grupper.

Saml de grundlæggende sammendragsstatistikker for de data, du har samlet. Den sammenfattende statistik inkluderer de individuelle datapunkter for den første gruppe, mærket "x", og antallet af datapunkter for den anden individuelle variant, "y." Antallet af datapunkter for hver gruppe er mærket "n."

Tilføj punkterne for den første gruppe, der er mærket "SX." Den anden gruppe af data, der er indsamlet, er "SY."

For at beregne middelværdien skal du bruge formlen, C \u003d (SX + SY) ^ 2 /(2n).

Beregn summen af kvadratet mellem grupperne, SSB \u003d [(SX ^ 2 + SY ^ 2) /n] - C.

Når du først har firkantede alle datapunkter, opsummer dem i en slut sum af "D.".

Beregn derefter summen af firkanter i alt, SST \u003d D - C.

Brug formlen SST - SSB for at finde SSW eller summen af firkanter inden for grupper.

Figur graden af frihed for mellem grupperne, "dfb," og inden for grupperne, "dfw."

Formlen for mellem grupper er dfb \u003d 1 og for de inden for grupper er den dfw \u003d 2n-2.

Beregn middelkvadratet for inden for grupper, MSW \u003d SSW /dfw.

Endelig beregne den endelige statistik, eller "F," F \u003d MSB /MSW