Frekvens tabeller kan være nyttige til at beskrive antallet af forekomster af en bestemt type datatype inden for et datasæt. Frekvensborde, også kaldet frekvensfordeling, er et af de mest grundlæggende værktøjer til visning af beskrivende statistikker. Frekvensborde anvendes i vid udstrækning som en oversigt over referencer til fordelingen af data; de er nemme at fortolke, og de kan vise store datasæt på en ret kortfattet måde. Frekvens tabeller kan hjælpe med at identificere indlysende tendenser inden for et datasæt og kan bruges til at sammenligne data mellem datasæt af samme type. Frekvens tabeller er imidlertid ikke passende for hver applikation. De kan skjule ekstreme værdier (mere end X eller mindre end Y), og de lænner sig ikke til analyser af dataernes skeve og kurtose.
Hurtig datavisualisering
Frekvens tabeller kan hurtigt afsløre outliers og endda betydelige tendenser inden for et datasæt med ikke meget mere end en kortvarig inspektion. For eksempel kan en lærer vise elevernes karakterer i midten af en frekvenstabel for at få et hurtigt kig på, hvordan hendes klasse gør det generelt. Nummeret i frekvenskolonnen repræsenterer antallet af elever, der modtager denne klasse; for en klasse på 25 studerende kan frekvensfordelingen af brevkvaliteter modtaget se sådan ud: Grade Frekvens A .............. 7 B ........... .13 C .............. 3 D .............. 2
Visualisering af relative overflod
Frekvens tabeller kan hjælpe forskere til at undersøge den relative overflod af hver enkelt måldata i deres prøve. Relativ overflod repræsenterer, hvor meget af datasættet der består af måldataene. Relativ overflod er ofte repræsenteret som et frekvenshistogram, men kan let vises i en frekvenstabel. Overvej den samme frekvensfordeling af midtvejsgrader. Relativ overflod er simpelthen den procentdel af de studerende, der har scoret en bestemt klasse, og kan være nyttige til konceptualisering af data uden at tænke over det. F.eks. Med den tilføjede kolonne, der viser den procentvise forekomst af hver klasse, kan du nemt se, at mere end halvdelen af klassen scorede et B uden at skulle granske dataene i meget detaljer.
Gradefrekvensrelativ Overflod (% frekvens) A .............. 7 .............. 28% B ............ .13 ............ 52% C .............. 3 ............. 12% D .. ............ 2 .............. 8%
Komplekse datasæt må muligvis klassificeres i intervaller
En Ulempen er, at det er svært at forstå komplekse datasæt, som vises på en frekvenskort. Store datasæt kan opdeles i intervalklasser for nem visualisering ved hjælp af en frekvenstabel. For eksempel, hvis du spurgte de næste 100 mennesker, ser du, hvad deres alder var, du vil sandsynligvis få en bred vifte af svar, der spænder overalt fra tre til treoghalvfems. I stedet for at inkludere rækker for hver alder i din frekvenskort, kan du klassificere dataene i intervaller, f.eks. 0 - 10 år, 11-20 år, 21-30 år og så videre. Dette kan også betegnes som en grupperet frekvensfordeling.
Frekvensborde kan skjule skege og Kurtosis
Medmindre det vises på et histogram, er skævhed og kurtose af data muligvis ikke synlige i en frekvens bord. Skævheden fortæller dig, hvilken retning dine data har tendens til. Hvis der blev vist karakterer på tværs af X-aksen i en graf, der viser hyppigheden af midtvejsgrader for vores 25 studerende ovenfor, vil fordelingens skævhed ske mod A'erne og B'erne. Kurtosis fortæller dig om din datas centrale spids - om det ville falde i overensstemmelse med en normal fordeling, som er en flot glat bellkurve eller være høj og skarp. Hvis du graver midtkvalitetsgraderne i vores eksempel, vil du finde en høj topp i B med et kraftigt fald i fordelingen af lavere karakterer.
Sidste artikelSådan beregnes termisk stress
Næste artikelHvad er forskellen mellem en kontrol og en kontrolleret variabel?