Videnskab
 science >> Videnskab >  >> Math

Hvad er huller, clusters og outliers i Math?

Forretnings-, regerings- og akademiske aktiviteter kræver næsten altid indsamling og analyse af data. En af måderne til at repræsentere numeriske data er gennem grafer, histogrammer og diagrammer. Disse visualiseringsteknikker gør det muligt for folk at få bedre indsigt i problemer og udforme løsninger. Gaps, klynger og outliers er karakteristika af datasæt, som påvirker matematisk analyse og er let synlige på visuelle repræsentationer.

Hul i dataene

Gaps henviser til manglende områder i et datasæt. For eksempel, hvis et videnskabeligt eksperiment indsamler temperaturdata i området fra 50 grader Fahrenheit til 100 grader Fahrenheit, men intet mellem 70 og 80 grader, ville det være et hul i datasættet. Et linjeplot af dette datasæt ville have "x" mærker for temperaturer mellem 50 og 70 og igen mellem 80 og 100, men der ville ikke være noget mellem 70 og 80. Forskere kan grave dybere og undersøge, hvorfor visse datapunkter ikke vises i en samlet prøve.

Isolerede grupper

Klynger er isolerede grupper af datapunkter. Linjeposter, som er en af ​​måderne til at repræsentere datasæt, er linjer med "x" -mærker placeret over specifikke tal for at skildre deres hyppighed af forekomst i datasættet. En klynge er afbildet som en samling af disse "x" -mærker i et lille interval eller datasubsæt. Hvis eksamensresultaterne for en klasse på 10 elever er 74, 75, 80, 72, 74, 75, 76, 86, 88 og 73, vil de fleste "x" -mærker på et linjeplot være i 72- til-76 score interval. Dette ville repræsentere en dataklynge. Bemærk frekvensen for 74 og 75 er to, men for alle andre scores er den en.

På Extremes

Outliers er ekstreme værdier - datapunkter, der ligger betydeligt uden for andre værdier i et datasæt. En outlier skal være signifikant mindre end eller større end flertallet af tal i et datasæt. Definitionen af ​​"ekstreme" afhænger af omstændighederne og en konsensus mellem de analytikere, der er involveret i forskningen. Outliers kan være dårlige datapunkter, også kendt som støj, eller de kan indeholde værdifulde oplysninger om det fænomen, der undersøges, og dataindsamlingsmetoden selv. For eksempel, hvis klassescores hovedsagelig ligger i 70-til-80-rækken, men et par scorer er i de lave 50'ere, kan de repræsentere outliers.

Sæt det hele sammen

Gaps , outliers og klynger i datasæt kan påvirke resultaterne af matematisk analyse. Gaps og klynger kan udgøre fejl i dataindsamlingsmetoden. Hvis en telefonundersøgelse f.eks. Kun kigger efter bestemte områdekoder, såsom lavindkomstkomplekser eller high-end forstæder, og ikke et bredt tværsnit af befolkningen, er der chancer for, at der vil være huller og klynger i dataene . Outliers kan skævme gennemsnitsværdien af ​​et datasæt. For eksempel er gennemsnitsværdien af ​​et datasæt bestående af fire tal - 50, 55, 65 og 90 - 65. Uden udleder 90 er gennemsnittet imidlertid ca. 57.