Videnskab
 science >> Videnskab >  >> Andet

Sådan beregnes interkvartilområdet

Det interkvartile interval, ofte forkortet som IQR, repræsenterer intervallet fra den 25th percentil til den 75. percentil eller den midterste 50 procent af et givet datasæt. Det interkvartile interval kan bruges til at bestemme, hvad det gennemsnitlige ydeevne for en test ville være: du kan bruge det til at se, hvor de fleste folks score på en bestemt test falder, eller bestemme, hvor mange penge den gennemsnitlige medarbejder i en virksomhed tjener hver måned . Det interkvartile interval kan være et mere effektivt værktøj til dataanalyse end middelværdien eller medianen for et datasæt, fordi det giver dig mulighed for at identificere spredningsområdet i stedet for kun et enkelt tal.

TL; DR (for lang) ; Læste ikke)

Interkvartilområdet (IQR) repræsenterer de midterste 50 procent af et datasæt. For at beregne det, skal du først bestille dine datapunkter fra mindst til størst, derefter bestemme dine første og tredje kvartilpositioner ved hjælp af formlerne (N + 1) /4 og 3 * (N + 1) /4, hvor N er tallet af punkter i datasættet. Til sidst trækker den første kvartil fra den tredje kvartil for at bestemme interkvartilområdet for datasættet.
Bestil datapunkter

Beregning af interkvartil rækkevidde er en simpel opgave, men inden beregningen skal du arrangere de forskellige punkter i dit datasæt. For at gøre dette skal du begynde med at bestille dine datapunkter fra mindst til størst. Hvis dine datapunkter f.eks. Var 10, 19, 8, 4, 9, 12, 15, 11 og 20, ville du omorganisere dem på denne måde: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Når dine datapunkter er blevet ordnet på denne måde, kan du gå videre til det næste trin.
Bestem første kvartilsposition -

Derefter bestemmes placeringen af det første kvartil ved hjælp af følgende formel: (N + 1 ) /4, hvor N er antallet af punkter i datasættet. Hvis den første kvartil falder mellem to tal, skal du tage gennemsnittet af de to numre som din første kvartil-score. I ovenstående eksempel, da der er ni datapunkter, vil du tilføje 1 til 9 for at få 10 og derefter dele med 4 for at få 2,5. Da den første kvartil falder mellem den anden og den tredje værdi, vil du tage gennemsnittet 8 og 9 for at få en første kvartil-position på 8,5.
Bestem tredje kvartil-position

Når du har bestemt din første kvartil, bestem positionen for den tredje kvartil ved hjælp af følgende formel: 3 * (N + 1) /4, hvor N igen er antallet af punkter i datasættet. Ligeledes, hvis den tredje kvartil falder mellem to tal, skal du blot tage gennemsnittet, som du ville gøre, når du beregner den første kvartil-score. I ovenstående eksempel, da der er ni datapunkter, vil du tilføje 1 til 9 for at få 10, ganges med 3 for at få 30 og derefter dele med 4 for at få 7,5. Da den første kvartil falder mellem den syvende og den ottende værdi, vil du tage gennemsnittet 15 og 19 for at få et tredje kvartilkarakter på 17.
Beregn interkvartsintervallet

Når du har bestemt din første og tredje kvartil, beregne interkvartilområdet ved at trække værdien af det første kvartil fra værdien af det tredje kvartil. For at afslutte det eksempel, der blev brugt i løbet af denne artikel, trækker du 8.5 fra 17 for at finde ud af, at interkvartilområdet i datasættet er lig med 8.5.
Fordele og ulemper ved IQR.

Interkvartilområdet har en fordel ved at være i stand til at identificere og eliminere outliers i begge ender af et datasæt. IQR er også et godt mål for variation i tilfælde af skæv datadistribution, og denne metode til beregning af IQR kan arbejde for grupperede datasæt, så længe du bruger en kumulativ frekvensfordeling til at organisere dine datapunkter. Interkvartilintervallformlen for grupperede data er den samme som for ikke-grupperede data, idet IQR er lig med værdien af den første kvartil, der trækkes fra værdien af den tredje kvartil. Det har dog flere ulemper i forhold til standardafvigelse: mindre følsomhed over for et par ekstreme scoringer og en prøveudtagningsstabilitet, der ikke er så stærk som standardafvigelse.