Videnskab
 science >> Videnskab >  >> Fysik

Sådan bestemmes kassebredden for et histogram

Hvis du arbejder med statistikker, kan du bruge histogrammer til at give et visuelt sammendrag af en samling af tal. Et histogram er lidt som et stregdiagram, der bruger en række lodrette kolonner side om side for at vise fordelingen af ​​data. For at lave et histogram sorterer du først dine data i "bakker" og tæller derefter antallet af datapunkter i hver bin. Højden af ​​hver kolonne i histogrammet er så proportional med antallet af datapunkter, som dets bin indeholder. Hvis du vælger det korrekte antal bakker, får du et optimalt histogram.

Beregn værdien af ​​kubets rod af antallet af datapunkter, der udgør dit histogram. For eksempel, hvis du laver et histogram på højden på 200 personer, ville du tage terningroten på 200, hvilket er 5.848. De fleste videnskabelige regnemaskiner vil have en kube rod-funktion, som du kan bruge til at udføre denne beregning.

Tag den omvendte af den værdi, du netop har beregnet. For at gøre dette kan du opdele værdien i 1 eller bruge "1 /x" tasten på en videnskabelig regnemaskine. Den inverse af 5.848 er 1 /5.848 = 0.171.

Multiplicér din nye værdi ved standardafvigelsen i dit datasæt. Standardafvigelsen er et mål for mængden af ​​variation i en række tal. Du kan bruge en regnemaskine med statistiske funktioner til at beregne dette tal for dine data eller beregne det manuelt. For at gøre sidstnævnte bestemme gennemsnittet af dine datapunkter; find ud af, hvor langt hver datapunkt er fra den gennemsnitlige; firkantet hver af disse forskelle og derefter gennemsnit dem; Tag derefter kvadratroten af ​​dette nummer. For eksempel, hvis standardafvigelsen for dine højdata var 2,8 tommer, ville du beregne 2,8 x 0,171 = 0,479.

Multiplicer det tal, du lige har afledt af 3.49. Værdien 3,49 er en konstant afledt af statistisk teori, og resultatet af denne beregning er den bakkebredde, du skal bruge til at konstruere et histogram af dine data. I tilfælde af højdeeksemplet vil du beregne 3,49 x 0,479 = 1,7 tommer. Dette betyder, at hvis din laveste højde var 5 fod, vil din første bin spænde 5 fod til 5 fod 1,7 tommer. Højden på kolonnen for denne bakke vil afhænge af, hvor mange af dine 200 målte højder var inden for dette område. Den næste bin vil være fra 5 fod 1,7 tommer til 5 fod 3,4 tommer, og så videre.

TL; DR (for længe, ​​ikke læst)

Nogle foretrækker at tage en meget mere uformel tilgang og vælger bare vilkårlige bin bredder, der producerer et passende defineret histogram.