Videnskab
 science >> Videnskab >  >> Math

Sådan tolk hierarkisk regression

Hierarkisk regression er en statistisk metode til at undersøge forholdene mellem og teste hypoteser om, en afhængig variabel og flere uafhængige variabler. Lineær regression kræver en numerisk afhængig variabel. De uafhængige variabler kan være numeriske eller kategoriske. Hierarkisk regression betyder, at de uafhængige variabler ikke indtastes i regressionen samtidigt, men i trin. For eksempel kan en hierarkisk regression undersøge forholdet mellem depression (målt ved en numerisk skala) og variabler, herunder demografi (som alder, køn og etnisk gruppe) i første fase og andre variabler (såsom scoringer på andre test) i en anden fase.

Fortolk den første fase af regressionen.

Se på den ubetingede regressionskoefficient (som kan kaldes B på din output) for hver uafhængig variabel. For kontinuerlige uafhængige variabler repræsenterer dette ændringen i den afhængige variabel for hver enhedsændring i den uafhængige variabel. I eksemplet, hvis alder havde en regressionskoefficient på 2,1, ville det betyde, at den forventede værdi af depression stiger med 2,1 enheder for hvert år.

For kategoriske variable skal udgangen vise en regressionskoefficient for hvert niveau af variablen undtagen en; den der mangler hedder referenceniveauet. Hver koefficient repræsenterer forskellen mellem dette niveau og referenceniveauet på den afhængige variabel. I eksemplet, hvis den referencetiske gruppe er "Hvid" og den ubetingede koefficient for "Sort" er -1,2, ville det betyde, at den forudsagte værdi af depression for sorte er 1,2 enheder lavere end for hvide.

Se på de standardiserede koefficienter (som kan mærkes med det græske brev beta). Disse kan fortolkes på samme måde som de ubetingede koefficienter, kun de er nu i form af standardafvigelsesenheder i den uafhængige variabel, i stedet for rå enheder. Dette kan hjælpe med at sammenligne de uafhængige variabler med hinanden.

Se på signifikansniveauerne eller p-værdierne for hver koefficient (disse kan være mærket "Pr & gt;" eller noget lignende). Disse fortæller dig, om den tilknyttede variabel er statistisk signifikant. Dette har en meget særlig betydning, som ofte er forkert. Det betyder, at en koefficient, der er høj eller højere i en stikprøve af denne størrelse, næppe ville forekomme, hvis den virkelige koefficient i hele befolkningen, hvorfra den er tegnet, var 0.

Se på R-kvadreret. Dette viser, hvilken andel af variationen i den afhængige variabel er beregnet af modellen.

Fortolk senere trin i regressionen, ændringen og det samlede resultat

Gentag ovenstående for hver senere regressionsstadiet.

Sammenlign de standardiserede koefficienter, ustandardiserede koefficienter, signifikansniveauer og r-squareds i hvert trin til det foregående trin. Disse kan være i separate sektioner af outputen eller i separate kolonner af en tabel. Denne sammenligning lader dig vide, hvordan variablerne i det andet (eller senere) stadium påvirker forholdene i første fase.

Se hele modellen, herunder alle faser. Se på de ustandardiserede og standardiserede koefficienter og signifikansniveauerne for hver variabel og R-kvadreret for hele modellen.

Advarsel

Dette er et meget komplekst emne.