Videnskab
 science >> Videnskab >  >> Fysik

Sådan beregnes tillidsniveauer

Statistik handler om at drage konklusioner i lyset af usikkerhed. Hver gang du tager en prøve, kan du ikke være helt sikker på, at din prøve virkelig afspejler den befolkning, den er trukket fra. Statistikere håndterer denne usikkerhed ved at tage de faktorer, der kan have indflydelse på estimatet, kvantificere deres usikkerhed og udføre statistiske test for at drage konklusioner fra disse usikre data.

Statistikere bruger tillidsintervaller til at specificere en række værdier, der er sandsynligvis indeholder den ”ægte” befolkning, gennemsnit på grundlag af en stikprøve, og udtrykker deres sikkerhedsniveau i dette gennem tillidsniveauer. Mens beregning af konfidensniveauer ikke ofte er nyttigt, er beregning af konfidensintervaller for et givet konfidensniveau en meget nyttig færdighed.

TL; DR (for lang; læste ikke)

Beregn en konfidensinterval for et givet konfidensniveau ved at multiplicere standardfejlen med Z
score for dit valgte konfidensniveau. Træk dette resultat fra dit prøve middel for at få den nedre grænse, og tilføj det til prøven gennemsnit for at finde den øvre grænse. (Se ressourcer)

Gentag den samme proces, men med t
-score i stedet for Z
-score for mindre prøver ( n
<30 ).

Find et konfidensniveau for et datasæt ved at tage halvdelen af størrelsen på konfidensintervallet, multiplicere det med kvadratroten af prøvestørrelsen og derefter dele med prøvestandardafvigelsen. Slå det resulterende Z
eller t
score i en tabel for at finde niveauet.
Forskellen mellem tillidsniveau vs. tillidsinterval

Når du ser en citeret statistik er der undertiden et interval, der er givet efter det, med forkortelsen “CI” (for “konfidensinterval”) eller blot et plus-minus-symbol efterfulgt af et tal. For eksempel “middelvægten af en voksen mand er 180 pund (CI: 178,14 til 181,86)” eller “middelvægten af en voksen mand er 180 ± 1,86 pund.” Disse begge fortæller dig den samme information: baseret på prøven brugt, falder en menneskes middelvægt sandsynligvis inden for et bestemt interval. Selve intervallet kaldes konfidensintervallet.

Hvis du vil være så sikker som muligt på, at området indeholder den sande værdi, kan du udvide området. Dette vil øge dit "tillidsniveau" i estimatet, men området vil dække flere potentielle vægte. De fleste statistikker (inklusive den citerede ovenfor) er angivet som 95 procent konfidensintervaller, hvilket betyder, at der er en 95 procent chance for, at den sande middelværdi er inden for området. Du kan også bruge et konfidensniveau på 99 procent eller et konfidensniveau på 90 procent, afhængigt af dine behov.
Beregning af tillidsintervaller eller niveauer for store prøver

Når du bruger et konfidensniveau i statistikker, har du normalt brug for det for at beregne et konfidensinterval. Dette er lidt nemmere at gøre, hvis du har en stor prøve, for eksempel over 30 personer, fordi du kan bruge Z
-score til dit estimat snarere end mere komplicerede t
-scoringer.

Tag dine rådata og beregn prøveeksemplaret (blot tilføj de individuelle resultater og divider med antallet af resultater). Beregn standardafvigelsen ved at trække gennemsnittet fra hvert individuelt resultat for at finde forskellen og derefter kvadratere denne forskel. Tilføj alle disse forskelle, og del derefter resultatet med prøvestørrelsen minus 1. Tag kvadratroten til dette resultat for at finde prøvestandardafvigelsen (Se Ressourcer).

Bestem konfidensintervallet ved først at finde den standardfejl:

SE

\u003d s
/√ n

Hvor s
er din prøvestandardafvigelse og n
er din prøvestørrelse. Hvis du for eksempel tog en prøve på 1.000 mænd for at beregne en mands gennemsnitsvægt og fik en prøvestandardafvigelse på 30, ville dette give:

SE

\u003d 30 /√1000 \u003d 30 /31.62 \u003d 0,95

For at finde konfidensintervallet fra dette, skal du slå op det konfidensniveau, du vil beregne intervallet for i en Z
-core tabel og multiplicer denne værdi med Z
score. For et 95 procent konfidensniveau er Z
-score 1,96. Ved hjælp af eksemplet betyder dette:

Gennemsnit ± Z
× SE
\u003d 180 pund ± 1,96 × 0,95 \u003d 180 ± 1,86 pund

Her, ± 1,86 pund er 95 procent konfidensinterval.

Hvis du i stedet har denne bit information sammen med prøvestørrelsen og standardafvigelsen, kan du beregne konfidensniveauet ved hjælp af følgende formel:

Z

\u003d 0,5 × størrelse af konfidensinterval × √ n
/ s

Størrelsen på konfidensinterval er kun dobbelt så meget som ± værdien, så i eksemplet ovenfor ved vi 0,5 gange, at dette er 1,86. Dette giver:

Z

\u003d 1,86 × √1000 /30 \u003d 1,96

Dette giver os en værdi for Z
, som du kan slå op i en Z
-score-tabel for at finde det tilsvarende konfidensniveau.
Beregning af tillidsintervaller for små prøver

For små prøver er der en lignende proces for beregning af konfidensintervallet. Træk først 1 fra din prøvestørrelse for at finde din “frihedsgrader.” I symboler:

df

\u003d n
−1

For en prøve n
\u003d 10 giver dette df
\u003d 9.

Find din alfaværdi ved at trække decimalversionen af konfidensniveauet ( dvs. dit procentvise konfidensniveau divideret med 100) fra 1 og dividerer resultatet med 2 eller i symboler:

α

\u003d (1 - decimal konfidensniveau) /2



Så for et 95 procent (0,95) konfidensniveau:

α

\u003d (1 - 0,95) /2 \u003d 0,05 /2 \u003d 0,025

Slå din alfa-værdi og frihedsgrader op i en (en hale) t-fordelingstabel og noter resultatet. Alternativt skal du udelade opdelingen med 2 ovenfor og bruge en <-> -tværdi med to hale. I dette eksempel er resultatet 2.262.

Som i det foregående trin, beregnes konfidensintervallet ved at multiplicere dette tal med standardfejlen, som bestemmes ved hjælp af din prøvestandardafvigelse og prøvestørrelse på samme måde. Den eneste forskel er, at i stedet for Z
-score, bruger du t-score.