Videnskab
 science >> Videnskab >  >> Andet

Sådan finder du korrelationskoefficienten for R i en spredningsdiagram

At finde styrken i forbindelsen mellem to variabler er en vigtig færdighed for forskere af alle typer. Hvis to variabler er korrelerede med hinanden, viser det, at der er en forbindelse mellem dem. En positiv korrelation betyder, at når den ene variabel stiger, den anden gør det også, og en negativ korrelation betyder, at når den ene variabel stiger, falder den anden. Korrelationer beviser ikke årsagssammenhæng, selvom det er muligt, at yderligere test vil bevise et årsagsforhold mellem variablerne. Korrelationskoefficient R viser styrken i forholdet mellem de to variabler, og om det er en positiv eller negativ korrelation.

TL; DR (for lang; læste ikke)

Opkald Beregn værdien af R ved hjælp af formlen:

R \u003d [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2− (Σx) 2] [ , 3, [[n Σy 2− (Σy) 2]}

Hvor n er din prøvestørrelse.

  1. Lav en tabel med dine data

    Lav en tabel over dine data. Dette skal omfatte en kolonne for deltagernummeret, en kolonne for den første variabel (mærket x) og en kolonne for den anden variabel (mærket y). Hvis du for eksempel ser for at se, om der er en sammenhæng mellem højde og skostørrelse, vil en kolonne identificere hver person, du måler, en kolonne viser hver persons højde og en anden viser deres skostørrelse. Lav yderligere tre kolonner, en til xy, en til x 2 og en til y 2.

  2. Beregn værdierne for de tomme kolonner

    Brug dine data at udfylde de tre yderligere kolonner. Forestil dig for eksempel, at din første person måler 75 tommer høj og har størrelse 12 fod. Kolonnen x (højde) viser 75, og kolonnen y (skostørrelse) viser 12. Du skal finde xy, x 2 og y 2. Så ved hjælp af dette eksempel:

    xy \u003d 75 × 12 \u003d 900

    x 2 \u003d 75 2 \u003d 5,625

    y 2 \u003d 12 2 \u003d 144

    Fuldfør disse beregninger for hver person, du har data til.

  3. Find summen af hver kolonne

    Opret en ny række ved bunden af din tabel for summerne af hver kolonne. Tilføj alle x-værdierne, alle y-værdierne, alle xy-værdierne, alle x 2-værdierne og alle y 2-værdierne, og sæt derefter resultaterne i bunden af tilsvarende kolonne i din nye række. Du kan markere din nye række "sum" eller bruge et sigma (Σ) -symbol.

  4. Beregn R ved hjælp af formlen

    Du finder R fra dine data ved hjælp af formlen:

    R \u003d [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2− (Σx) 2] [nΣy 2− (Σy) 2]}

    Dette ser lidt skræmmende ud, så du kan opdele det i to dele, som vi kalder s og t.

    s \u003d n (Σxy) - (Σx) ( Σy)

    t \u003d √ {[n Σx 2− (Σx) 2] [n Σy 2− (Σy) 2]}

    I disse ligninger er n antallet af deltagere, du har (din prøvestørrelse). Resten af ligningens dele er de summer, du har beregnet i det sidste trin. Så for s, ganges størrelsen på din prøve med summen af xy-kolonnen, og træk derefter summen af x-kolonnen ganget med summen af y-kolonnen fra denne.

    For t er der fire vigtigste trin. Beregn først n ganget med summen af din x 2-kolonne, og træk derefter summen af din kvadrat med x-kolonne (ganget med sig selv) fra denne værdi. For det andet skal du gøre nøjagtigt den samme ting, men med summen af y 2-kolonnen og summen af y-kolonnen i kvadrat i stedet for x-delene (dvs. n × Σy 2 - [Σy × Σy]) . For det tredje skal du multiplicere disse to resultater (for xs og ys) sammen. For det fjerde, tag kvadratroten af dette svar.

    Hvis du har arbejdet i dele, kan du beregne R som simpelthen R \u003d s ÷ t. Du får et svar mellem −1 og 1. Et positivt svar viser en positiv sammenhæng, hvor alt over 0,7 generelt betragtes som et stærkt forhold. Et negativt svar viser en negativ korrelation, hvor alt over -0,7 betragtes som et stærkt negativt forhold. Tilsvarende betragtes ± 0,5 som et moderat forhold, og ± 0,3 betragtes som et svagt forhold. Noget tæt på 0 viser en mangel på sammenhæng.