Videnskab
 science >> Videnskab >  >> Andet

Sådan finder du prøvestandardafvigelse

Statistiske prøver såsom t-testen afhænger i sig selv af begrebet standardafvigelse. Enhver studerende i statistik eller naturvidenskab bruger regelmæssigt standardafvigelser og bliver nødt til at forstå, hvad det betyder, og hvordan man finder det fra et datasæt. Heldigvis er det eneste, du har brug for, de originale data, og selvom beregningerne kan være kedelige, når du har en masse data, skal du i disse tilfælde bruge funktioner eller regnearksdata til at gøre det automatisk. Alt hvad du skal gøre for at forstå nøglekonceptet er imidlertid at se et grundlæggende eksempel, som du nemt kan arbejde ud med i hånden. Som kerne måler prøvestandardafvigelsen, hvor meget den mængde, du har valgt, varierer i hele befolkningen baseret på din prøve.

TL; DR (for lang; læste ikke)

Brug af n
til at betyde prøvestørrelse, μ
til gennemsnittet af dataene, x
i for hvert individuelt datapunkt (fra i
\u003d 1 til i
\u003d n
), og Σ som et summeringstegn, er prøvevariansen ( s og 2):

s

2 \u003d (Σ x
i - μ
) 2 /( n
- 1)

Og standardstandardafvigelsen er:

s

\u003d √ s

2 - Standardafvigelse vs. prøve Standardafvigelse

Statistik drejer sig om at foretage estimater for hele populationer baseret på mindre prøver fra befolkningen og udgøre enhver usikkerhed i estimering i processen. Standardafvigelser kvantificerer variationen i den befolkning, du studerer. Hvis du forsøger at finde den gennemsnitlige højde, får du en klynge af resultater omkring middelværdien (gennemsnittet), og standardafvigelsen beskriver bredden på klyngen og fordelingen af højder over befolkningen.

Standardafvigelsen "stikprøve" estimerer den sande standardafvigelse for hele befolkningen baseret på en lille stikprøve fra befolkningen. Det meste af tiden vil du ikke være i stand til at prøve hele den pågældende population, så prøvestandardafvigelsen er ofte den rigtige version at bruge.
Finde prøvestandardafvigelsen

Du har brug for dine resultater og antallet ( n
) af personer i din prøve. Beregn først gennemsnittet af resultaterne ( μ
) ved at tilføje alle de individuelle resultater og derefter dele dette med antallet af målinger.

Som et eksempel er hjerterytmen (i slag per minut) af fem mænd og fem kvinder er:

71, 83, 63, 70, 75, 69, 62, 75, 66, 68 og

Hvilket fører til et middel til:

μ

\u003d (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10

\u003d 702 ÷ 10 \u003d 70.2

Det næste trin er at trække gennemsnittet fra hver enkelt måling og derefter kvadratere resultatet. Som et eksempel for det første datapunkt:

(71 - 70.2) 2 \u003d 0.8 2 \u003d 0.64

Og for det andet:

(83 - 70.2) 2 \u003d 12.8 2 \u003d 163.84

Du fortsætter på denne måde gennem dataene, og tilføj derefter disse resultater op. Så for eksempeldataene er summen af disse værdier:

0,64 + 163,84 + 51,84 + 0,04 + 23,04 + 1,44 + 67,24 +23,04 + 17,64 + 4,84 \u003d 353,6

Det næste trin skelner mellem prøven standardafvigelse og populationsstandardafvigelsen. For prøveafvigelsen deler du dette resultat med prøvestørrelsen minus en ( n
−1). I vores eksempel n
\u003d 10, så n
- 1 \u003d 9.

Dette resultat giver prøvevariansen, betegnet med s
< sup> 2, som for eksemplet er:

s

2 \u003d 353.6 ÷ 9 \u003d 39.289

Eksempelstandardafvigelsen ( s
) er bare den positive firkantede rod til dette nummer:

s

\u003d √39.289 \u003d 6.268

Hvis du beregnet populationsstandardafvigelsen ( σ
), den eneste forskel er, at du deler med n
snarere end n
−1.

Hele formel til prøvestandardafvigelse kan udtrykkes ved hjælp af summationssymbolet Σ, med summen over hele prøven, og x
i repræsenterer i_th resultatet ud af _n
. Eksempelvariansen er:

s

2 \u003d (Σ x
i - μ
) 2 /( n
- 1)

Og prøvestandardafvigelsen er simpelthen:

s

\u003d √ s

2 - Middelafvigelse vs. standardafvigelse

Middelafvigelsen adskiller sig lidt fra standardafvigelsen. I stedet for at kvadrere forskellene mellem middelværdien og hver værdi, tager du i stedet bare den absolutte forskel (ignorerer minus minus tegn) og finder derefter gennemsnittet af dem. For eksemplet i det foregående afsnit giver de første og andet datapunkter (71 og 83):

x

1 - μ
\u003d 71 - 70.2 \u003d 0.8

x
2 - μ
\u003d 83 - 70.2 \u003d 12.8

Det tredje datapunkt giver et negativt resultat

x

3 - μ
\u003d 63 - 70.2 \u003d −7.2

Men du bare fjern minus-tegnet og tag dette som 7.2.

Summen af alle disse giver divideret med n
giver middelafvigelsen. I eksemplet:

(0,8 + 12,8 + 7,2 + 0,2 + 4,8 + 1,2 + 8,2 + 4,8 + 4,2 + 2,2) ÷ 10 \u003d 46,4 ÷ 10 \u003d 4,64

Dette adskiller sig væsentligt fra standardafvigelse beregnet før, fordi det ikke involverer firkanter og rødder.