Statistik handler om at drage konklusioner i lyset af usikkerhed. Hver gang du tager en prøve, kan du ikke være helt sikker på, at din prøve virkelig afspejler den befolkning, den er trukket fra. Statistikere håndterer denne usikkerhed ved at tage de faktorer, der kan have indflydelse på estimatet, kvantificere deres usikkerhed og udføre statistiske test for at drage konklusioner fra disse usikre data.
Statistikere bruger tillidsintervaller til at specificere en række værdier, der er sandsynligvis indeholder den ”ægte” befolkning, gennemsnit på grundlag af en stikprøve, og udtrykker deres sikkerhedsniveau i dette gennem tillidsniveauer. Mens beregning af konfidensniveauer ikke ofte er nyttigt, er beregning af konfidensintervaller for et givet konfidensniveau en meget nyttig færdighed.
TL; DR (for lang; læste ikke)
Beregn en konfidensinterval for et givet konfidensniveau ved at multiplicere standardfejlen med Z Gentag den samme proces, men med t Find et konfidensniveau for et datasæt ved at tage halvdelen af størrelsen på konfidensintervallet, multiplicere det med kvadratroten af prøvestørrelsen og derefter dele med prøvestandardafvigelsen. Slå det resulterende Z Når du ser en citeret statistik er der undertiden et interval, der er givet efter det, med forkortelsen “CI” (for “konfidensinterval”) eller blot et plus-minus-symbol efterfulgt af et tal. For eksempel “middelvægten af en voksen mand er 180 pund (CI: 178,14 til 181,86)” eller “middelvægten af en voksen mand er 180 ± 1,86 pund.” Disse begge fortæller dig den samme information: baseret på prøven brugt, falder en menneskes middelvægt sandsynligvis inden for et bestemt interval. Selve intervallet kaldes konfidensintervallet. Hvis du vil være så sikker som muligt på, at området indeholder den sande værdi, kan du udvide området. Dette vil øge dit "tillidsniveau" i estimatet, men området vil dække flere potentielle vægte. De fleste statistikker (inklusive den citerede ovenfor) er angivet som 95 procent konfidensintervaller, hvilket betyder, at der er en 95 procent chance for, at den sande middelværdi er inden for området. Du kan også bruge et konfidensniveau på 99 procent eller et konfidensniveau på 90 procent, afhængigt af dine behov. Når du bruger et konfidensniveau i statistikker, har du normalt brug for det for at beregne et konfidensinterval. Dette er lidt nemmere at gøre, hvis du har en stor prøve, for eksempel over 30 personer, fordi du kan bruge Z Tag dine rådata og beregn prøveeksemplaret (blot tilføj de individuelle resultater og divider med antallet af resultater). Beregn standardafvigelsen ved at trække gennemsnittet fra hvert individuelt resultat for at finde forskellen og derefter kvadratere denne forskel. Tilføj alle disse forskelle, og del derefter resultatet med prøvestørrelsen minus 1. Tag kvadratroten til dette resultat for at finde prøvestandardafvigelsen (Se Ressourcer). Bestem konfidensintervallet ved først at finde den standardfejl: SE Hvor s SE For at finde konfidensintervallet fra dette, skal du slå op det konfidensniveau, du vil beregne intervallet for i en Z Gennemsnit ± Z Her, ± 1,86 pund er 95 procent konfidensinterval. Hvis du i stedet har denne bit information sammen med prøvestørrelsen og standardafvigelsen, kan du beregne konfidensniveauet ved hjælp af følgende formel: Z Størrelsen på konfidensinterval er kun dobbelt så meget som ± værdien, så i eksemplet ovenfor ved vi 0,5 gange, at dette er 1,86. Dette giver: Z Dette giver os en værdi for Z For små prøver er der en lignende proces for beregning af konfidensintervallet. Træk først 1 fra din prøvestørrelse for at finde din “frihedsgrader.” I symboler: df For en prøve n Find din alfaværdi ved at trække decimalversionen af konfidensniveauet ( dvs. dit procentvise konfidensniveau divideret med 100) fra 1 og dividerer resultatet med 2 eller i symboler: α α Slå din alfa-værdi og frihedsgrader op i en (en hale) t-fordelingstabel og noter resultatet. Alternativt skal du udelade opdelingen med 2 ovenfor og bruge en <-> -tværdi med to hale. I dette eksempel er resultatet 2.262. Som i det foregående trin, beregnes konfidensintervallet ved at multiplicere dette tal med standardfejlen, som bestemmes ved hjælp af din prøvestandardafvigelse og prøvestørrelse på samme måde. Den eneste forskel er, at i stedet for Z
score for dit valgte konfidensniveau. Træk dette resultat fra dit prøve middel for at få den nedre grænse, og tilføj det til prøven gennemsnit for at finde den øvre grænse. (Se ressourcer)
-score i stedet for Z
-score for mindre prøver ( n
<30 ).
eller t
score i en tabel for at finde niveauet.
Forskellen mellem tillidsniveau vs. tillidsinterval
Beregning af tillidsintervaller eller niveauer for store prøver
-score til dit estimat snarere end mere komplicerede t
-scoringer.
\u003d s
/√ n
er din prøvestandardafvigelse og n
er din prøvestørrelse. Hvis du for eksempel tog en prøve på 1.000 mænd for at beregne en mands gennemsnitsvægt og fik en prøvestandardafvigelse på 30, ville dette give:
\u003d 30 /√1000 \u003d 30 /31.62 \u003d 0,95
-core tabel og multiplicer denne værdi med Z
score. For et 95 procent konfidensniveau er Z
-score 1,96. Ved hjælp af eksemplet betyder dette:
× SE
\u003d 180 pund ± 1,96 × 0,95 \u003d 180 ± 1,86 pund
\u003d 0,5 × størrelse af konfidensinterval × √ n
/ s
\u003d 1,86 × √1000 /30 \u003d 1,96
, som du kan slå op i en Z
-score-tabel for at finde det tilsvarende konfidensniveau.
Beregning af tillidsintervaller for små prøver
\u003d n
−1
\u003d 10 giver dette df
\u003d 9.
\u003d (1 - decimal konfidensniveau) /2
Så for et 95 procent (0,95) konfidensniveau:
\u003d (1 - 0,95) /2 \u003d 0,05 /2 \u003d 0,025
-score, bruger du t-score.
Sidste artikelSådan beregnes Contact Force
Næste artikelSådan beregnes konduktans