Videnskab
 Science >> Videnskab & Opdagelser >  >> Matematik

Beregning af standardfejlen for en regressionshældning:En praktisk vejledning

Af Thomas BourdinOpdateret 30. august 2022

Tevarak/iStock/GettyImages

Lineær regression er en hjørnesten i statistisk analyse, hvilket giver os mulighed for at estimere forholdet mellem en prædiktorvariabel x og en svarvariabel y ved hjælp af ligningen y = mx + b . Mens den tilpassede linje ofte fanger den underliggende trend, passerer den sjældent perfekt gennem hvert datapunkt. De resulterende uoverensstemmelser - kaldet residualer - introducerer usikkerhed i vores parameterestimater, især hældningen m . Standardfejlen for hældningen kvantificerer denne usikkerhed, hvilket muliggør konfidensintervaller og hypotesetests.

Trin 1:Beregn summen af kvadratiske rester (SSR)

SSR er summen af de kvadrerede forskelle mellem observerede y værdier og værdierne forudsagt af den tilpassede linje. For eksempel, hvis de observerede værdier er 2,7, 5,9 og 9,4, og modellen forudsiger 3, 6 og 9, er de kvadrerede residualer henholdsvis 0,09, 0,01 og 0,16. Tilføjelse af dem giver en SSR på 0,26.

Trin 2:Estimer variansen af resterne

Divider SSR med frihedsgrader, som er antallet af observationer minus to (for hældning og skæring). I eksemplet med tre observationer er divisoren 1, hvilket giver et variansestimat på 0,26. Kald denne værdi A .

Trin 3:Tag kvadratroden af variansestimatet

Kvadratroden af A (√0,26) er lig med 0,51. Denne værdi repræsenterer standardafvigelsen for residualerne og vil blive brugt i den endelige beregning.

Trin 4:Beregn den forklarede sum af kvadrater (ESS) for x

ESS måler variabiliteten af prædiktorvariablen omkring dens middelværdi. For x værdier på 1, 2 og 3, er middelværdien 2. Subtrahering af middelværdien og kvadrering af hver forskel giver 1, 0 og 1, som summerer til 2. Således er ESS =2.

Trin 5:Tag kvadratroden af ESS

Kvadratroden af ESS (√2) er 1,41. Betegn dette som B .

Trin 6:Beregn standardfejlen for hældningen

Divider kvadratroden af variansestimatet (trin 3) med kvadratroden af ESS (trin 5):0,51 ÷ 1,41 =0,36. Denne værdi – 0,36 – er standardfejlen for hældningen.

TL;DR

For store datasæt skal du automatisere beregningen for at undgå manuelle fejl og spare tid.