Videnskab
 science >> Videnskab >  >> Math

Fordele og ulemper ved en boksplot

En boksplot, også kendt som en boks og whisker plot, er en type graf, der viser et resumé af en stor mængde data i fem tal. Disse tal omfatter median, øvre kvartil, lavere kvartil, minimale og maksimale dataværdier. Som med mange statistiske grafer har boksplotningsmetoden fordele og ulemper.

TL; DR (for lang tid, ikke læst)

Box og whisker plots håndterer store data uden problemer, men de behold ikke de nøjagtige værdier og detaljerne for resultaterne af fordelingen. Disse grafer tillader et klart resumé af store mængder data.

Håndterer store data nemt

På grund af det fem-talede datasammendrag kan en boksplot håndtere og præsentere et resumé af en stor mængde af data. En boksplot består af medianen, som er midtpunktet for dataområdet; de øverste og nederste kvartiler, som repræsenterer tallene over og under dataens højeste og nederste kvartal og de mindste og maksimale dataværdier. Organiseringen af ​​data i en boksplot ved hjælp af fem nøglebegreber er en effektiv måde at håndtere store data for uhåndterlige på for andre grafer, såsom linjeposter eller stamme- og bladplotter.

Præcise værdier ikke tilbageholdt

Boksplottet beholder ikke de nøjagtige værdier og detaljer for distributionsresultaterne, hvilket er et problem med håndtering af så store mængder data i denne graftype. En boksplot viser kun et simpelt resumé af fordelingen af ​​resultater, så du hurtigt kan se det og sammenligne det med andre data. Brug en boksplot i kombination med en anden statistisk grafmetode som et histogram til en mere grundig og mere detaljeret analyse af dataene.

En klar oversigt

En boksplot er en meget visuel Effektiv måde at se et klart resumé af et eller flere sæt data på. Det er særligt nyttigt for hurtigt at opsummere og sammenligne forskellige sæt resultater fra forskellige eksperimenter. Et kort oversigt giver en grafisk visning af fordelingen af ​​resultater og giver indikationer af symmetri inden for dataene.

Viser udlæsere

En låseplot er en af ​​meget få statistiske grafemetoder der viser outliers. Der kan være en outlier eller flere outliers inden for et sæt data, som forekommer både under og over minimum og maksimum data værdier. Ved at udvide de mindre og større dataværdier til maksimalt 1,5 gange interkvartilområdet, giver boksplottet afvigere eller uklare resultater. Eventuelle resultater af data, der falder uden for minimums- og maksimumsværdierne kendt som outliers, er let at bestemme på en boksplotdiagram.