Hvorfor større prøvestørrelser styrker videnskabelige resultater

Af Jon Zamboni | Opdateret 30. august 2022

ALFSnaiper/iStock/GettyImages

I forskning er antallet af observationer - ofte betegnet som n - er afgørende for pålidelige resultater. En større stikprøve giver et klarere billede af befolkningen, reducerer indflydelsen af unormale data og strammer fejlmarginen.

TL;DR

Store stikprøvestørrelser giver mere præcise gennemsnit, fremhæver sande outliers og formindsker konfidensintervaller, hvilket gør resultaterne mere troværdige.

Prøvestørrelse

Prøvestørrelse refererer til antallet af datapunkter indsamlet i en undersøgelse eller et eksperiment. For eksempel betyder testning af 100 havvandsprøver for olierester en prøvestørrelse på 100; undersøgelse af 20.000 individer om angst giver en stikprøvestørrelse på 20.000. Mens større stikprøver kræver flere ressourcer, er udbyttet rigere og mere robuste data.

Middelværdi og outliers

Beregning af middelværdien – det aritmetiske gennemsnit – bliver mere nøjagtig som n vokser. Overvej at måle højden:Med 40 deltagere kan gennemsnittet være 5 ft 4 in, men med 100 deltagere kan det skifte til 5 ft 3 in, hvilket giver et mere repræsentativt estimat. Et større datasæt afslører også ægte outliers - værdier, der afviger markant fra gennemsnittet - hvilket giver værdifuld indsigt til yderligere undersøgelse.

Faren ved små prøver

Små prøver er sårbare over for skæve resultater. At undersøge kun fire personer om politisk tilhørsforhold og finde én uafhængig vælger ville fejlagtigt antyde, at 25 % af befolkningen er uafhængige. Udvidelse af stikprøven fortynder virkningen af sådanne anomalier, hvilket sikrer, at statistik afspejler virkeligheden.

Fejlmargin

Prøvestørrelsen påvirker direkte en statistiks fejlmargin. For binære spørgsmål (f.eks. bilejerskab) er fejlmarginen ca. 100÷√n . En prøve på 100 giver en margin på 10 %. For kontinuerlige metrikker (f.eks. højde) skal du gange dette tal med to gange standardafvigelsen for at fange variabilitet. I alle tilfælde større n krymper marginen, hvilket styrker tilliden til resultaterne.

Sidste artikelForståelse af ikke-nul-tal:Betydningen af nuller i naturvidenskab og matematik

Næste artikelBeregning af areal under kurver med en grafregner:En trin-for-trin guide