Statistikere og forskere har ofte et krav om at undersøge forholdet mellem to variabler, ofte kaldet x og y. Formålet med at teste eventuelle to sådanne variabler er normalt at se, om der er nogen forbindelse mellem dem, kendt som en sammenhæng i videnskab. For eksempel kan en videnskabsmand måske vide, om timer med soleksponering kan knyttes til hastigheden af hudkræft. For matematisk at beskrive styrken ved en sammenhæng mellem to variabler bruger sådanne efterforskere ofte R2.
Lineær regression
Statistikere bruger teknikken med lineær regression for at finde den lige linje, der bedst passer til en serie af x og y datapar. De gør dette gennem en række beregninger, der udleder ligningen af den bedste linje. Denne matematiske beskrivelse af linjen vil være en lineær ligning og have den generelle form for y \u003d mx + b, hvor x og y er de to variabler i dataparene, m er linjens hældning og b er dens y-skærm.
Korrelationskoefficient
Beregningerne, der finder den bedste lige linje, vil producere en lineær ligning, der passer til ethvert datasæt, selvom disse data faktisk ikke er meget lineære. For at have en indikation af, hvor godt dataene faktisk passer til en lige linje, beregner statistikere også et tal kendt som korrelationskoefficient. Dette får symbolet r eller R og er et mål for, hvor tæt oprettede datapar er til den bedste lige linje gennem dem.
Betydning af R
R kan have en hvilken som helst værdi mellem -1 og 1 En negativ værdi af R betyder simpelthen, at den rette pasform lige linie skråner nedad bevæger sig fra venstre mod højre i stedet for opad. Jo tættere R er enten på de to ekstremer, jo bedre er datapunkternes pasning til linjen, hvor enten -1 eller 1 er en perfekt pasform og en R-værdi på nul, hvilket betyder, at der ikke er nogen pasning, og punkterne er helt tilfældigt. Hvis datapunkterne er godt tilpasset den lige linje, siges der at være en vis korrelation mellem dem, og dermed er navnet korrelationskoefficient for R.
R2
Nogle statistikere foretrækker at arbejde med værdien af R2 , der simpelthen er korrelationskoefficienten kvadratisk eller ganget med sig selv og er kendt som bestemmelseskoefficienten. R2 ligner meget R og beskriver også sammenhængen mellem de to variabler, men den er også lidt anderledes. Det måler procentdelen af variationen i y-variablen, som kan tilskrives variationen i x-variablen. En R2-værdi på 0,9 betyder for eksempel, at 90 procent af variationen i y-dataene skyldes variation i x-dataene. Dette betyder ikke nødvendigvis, at x virkelig påvirker y, men at det ser ud til at gøre det.
Sidste artikelSådan finder du radius fra diameter
Næste artikelKvantitative Vs. Kvalitative data og laboratorietest