Videnskab
 science >> Videnskab >  >> Math

Sådan Find Korrelationskoefficienten for R i en Scatter Plot

Find styrken af ​​foreningen mellem to variabler er en vigtig færdighed for forskere af alle typer. Hvis to variable er korreleret med hinanden, viser det sig, at der er et link mellem dem. En positiv korrelation betyder, at når en variabel stiger, gør den anden også, og en negativ korrelation betyder, at når en variabel stiger, falder den anden. Korrelationer beviser ikke årsagssammenhæng, selvom det er muligt, at yderligere tests vil vise et årsagsforhold mellem variablerne. Korrelationskoefficienten R viser styrken af ​​forholdet mellem de to variabler, og om det er en positiv eller en negativ korrelation.

TL; DR (for lang, ikke læst)

Ring en variabel x og en variabel y. Beregn værdien af ​​R ved hjælp af formlen:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2- (Σx) 2] [ ,null,null,3],n Σy 2- (Σy) 2]}

Hvor n er din stikstørrelse.

Lav en tabel med dine data

Lav en tabel af dine data. Dette skal indeholde en kolonne for deltagernummeret, en kolonne for den første variabel (mærket x) og en kolonne for den anden variabel (mærket y). Hvis du f.eks. Søger at se, om der er en sammenhæng mellem højde og skostørrelse, vil en kolonne identificere hver person, du måler, en kolonne viser hver persons højde, og en anden vil vise deres skostørrelse. Lav tre yderligere kolonner, en til xy, en for x 2 og en for y 2.

Beregn værdierne for de tomme kolonner

Brug dine data til at udfylde de tre ekstra kolonner. For eksempel forestil dig, at din første person måler 75 inches høj og har størrelse 12 fod. Kolonnen x (højde) viser 75, og kolonnen y (skostørrelse) vil vise 12. Du skal finde xy, x 2 og y 2. Så bruger dette eksempel:

xy = 75 × 12 = 900

x 2 = 75 2 = 5,625

y 2 = 12 2 = 144

Fuldfør disse beregninger for hver person, som du har data til.

Find summen af ​​hver kolonne

Opret en ny række nederst på dit bord for summen af ​​hver kolonne. Tilføj alle x-værdierne, alle y-værdierne, alle xy-værdierne, alle x 2 værdierne og alle y 2 værdierne, og sæt derefter resultaterne nederst på tilsvarende kolonne i din nye række. Du kan mærke din nye række "sum" eller bruge et sigma (Σ) symbol.

Beregn R med Formula

Du finder R fra dine data ved hjælp af formlen:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2- (Σx) 2] [nΣy 2- (Σy) 2]}

Det ser lidt skræmmende ud, så du kan opdele det i to dele, som vi kalder s og t.

s = n (Σxy) - (Σx) (Σy)

t = √ {[n Σx 2- (Σx) 2] [n Σy 2- (Σy) 2]}

I disse ligninger, n er antallet af deltagere, du har (din stikstørrelse). Resten af ​​ligningens dele er de beløb, du har beregnet i sidste trin. Så for s multiplicerer du størrelsen af ​​din prøve ved summen af ​​xy-kolonnen, og trækker derefter summen af ​​x-søjlen multipliceret med summen af ​​y-kolonnen herfra.

For t er der fire hovedtrin. Først skal du beregne n multipliceret med summen af ​​din x 2 kolonne og derefter trække summen af ​​din x-kolonne kvadreret (multipliceret med sig selv) fra denne værdi. For det andet gør du nøjagtig det samme, men med summen af ​​y 2 kolonnen og summen af ​​y-kolonnen kvadreret i stedet for x-delene (dvs. n × Σy 2 - [Σy × Σy]) . For det tredje multiplicere disse to resultater (for xs og ys) sammen. For det fjerde tager du kvadratroden til dette svar.

Hvis du har arbejdet i dele, kan du beregne R som blot R = s ÷ t. Du får svar mellem -1 og 1. Et positivt svar viser en positiv sammenhæng, med noget over 0,7 anses generelt for et stærkt forhold. Et negativt svar viser en negativ korrelation, med noget over -0,7 betragtes som et stærkt negativt forhold. Tilsvarende ± 0,5 betragtes som et moderat forhold, og ± 0,3 betragtes som et svagt forhold. Alt tæt på 0 viser mangel på korrelation.