Videnskab
 Science >> Videnskab >  >> Math

Interquartile Range:Sådan beregnes og visualiseres IQR

# Interkvartilområde (IQR)

Interkvartilområdet (IQR) er et mål for variabilitet, eller hvor spredt et datasæt er. Det beregnes ved at trække den første kvartil (Q1) fra den tredje kvartil (Q3).

$$IQR =Q3-Q1$$

Det er et mere robust mål for variabilitet end intervallet, fordi det ikke er påvirket af outliers.

Sådan beregnes IQR

For at beregne IQR skal du først finde medianen af ​​datasættet. Medianen er den midterste værdi af datasættet, når det er sorteret i stigende rækkefølge. Hvis der er to midterste tal, er medianen gennemsnittet af disse to tal.

Når du har medianen, kan du finde den første kvartil og den tredje kvartil.

Første kvartil (Q1):

- er den midterste værdi af den nederste halvdel af dataene

- For et datasæt med et ulige antal værdier:Q1 er værdien i midten

- For et datasæt med lige antal værdier er Q1 gennemsnittet af de to midterste værdier.

Tredje kvartil (Q3):

- er den midterste værdi af den øverste halvdel af datasættet.

- For datasæt med ulige antal værdier:Q3 er værdien i midten

- For et datasæt med lige antal værdier er Q3 gennemsnittet af de to midterste værdier

Når du har Q1 og Q3, kan du beregne IQR som

$$IQR =Q3-Q1$$

Eksempel:

Beregn IQR for dataene:

2, 4, 5, 7, 9, 11, 13, 15, 17, 19

1. Find medianen:

Sorter numre fra mindste til største

2, 4, 5, 7, 9, 11, 13, 15, 17, 19

Median =(9+11)/2 =10

2. Find Q1 og Q3 :

Halvvejs ligger dataene under 10, og halvdelen ligger over

Den nederste halvdel:2, 4, 5, 7, 9

Q1, den midterste værdi af den nederste halvdel =7

Den øverste halvdel:11, 13, 15, 17, 19

Q3, den midterste værdi af den øverste halvdel =15

3. Beregn IQR :

$$IQR =Q3 - Q1$$

$$IQR =15 - 7 =8 $$

Derfor er IQR for det givne datasæt 8.

Visualisering af IQR

IQR kan visualiseres ved hjælp af et boksplot. Et boksplot viser medianen, Q1, Q3 og rækkevidden af ​​dataene.

```

+------------------------+

| | |

| | | |

|----------------|---|----------------|

| | | | | |

+------------------------+

```

- Kassen: repræsenterer de midterste 50 % af data (mellem 1. kvartal og 3. kvartal)

- Linjen i boksen: repræsenterer medianen

- Kassens ender (skårhår): udvide til de mest ekstreme værdier, der ikke betragtes som afvigere

- Udgåerne: er værdier, der er mere end 1,5 gange IQR over Q3 eller under Q1.

De er repræsenteret som individuelle punkter uden for knurhårene.

Boxplots er et nyttigt værktøj til visuelt at sammenligne fordelingen af ​​forskellige datasæt.

Oversigt

Interquartile range (IQR) er et mål for variabilitet, der ikke påvirkes af outliers.

Det beregnes ved at trække den første kvartil (Q1) fra den tredje kvartil (Q3).

IQR kan visualiseres ved hjælp af boksplot.