Videnskab
 science >> Videnskab >  >> Math

Sådan beregnes LSRL

Den mindste kvadratregressionslinje (LSRL) er en linje, der tjener som en forudsigelsesfunktion til et fænomen, der ikke er kendt. Den matematiske statistiske definition af en mindstekvadratregressionslinje er linien, som passerer gennem punktet (0,0), og har en hældning svarende til korrelationskoefficienten for dataene, efter at dataene er standardiseret. Således omfatter beregning af mindstekvadratregressionslinjen standardisering af dataene og finde korrelationskoefficienten.

Find korrelationskoefficienten

Arranger dine data, så det er nemt at arbejde med. Brug et regneark eller en matrix til at adskille dine data i sine x-værdier og y-værdier, holde dem linket (dvs. sørg for, at hvert datapunkts x-værdi og y-værdi er i samme række eller kolonne). > Find krydsprodukterne af x-værdierne og y-værdierne. Multiplicér x-værdien og y-værdien for hvert punkt sammen. Sum disse resulterende værdier. Kald resultatet "sxy".

Sumér x-værdierne og y-værdierne separat. Kald disse to resulterende værdier "sx" og "sy".

Tæl antallet af datapunkter. Kald denne værdi "n."

Tag summen af ​​kvadrater til dine data. Firkant alle dine værdier. Multiplicér hver x-værdi og hver y-værdi af sig selv. Kald de nye sæt data "x2" og "y2" til x-værdierne og y-værdierne. Sum alle x2-værdierne og kalder resultatet "sx2." Sum alle y2-værdierne og kalder resultatet "sy2."

Træk sx * sy /n fra sxy. Kald resultatet "num."

Beregn værdien sx2- (sx ^ 2) /n. Kald resultatet "A."

Beregn værdien sy2- (sy ^ 2) /n. Kald resultatet "B."

Tag kvadratroden af ​​A gange B, som kan vises som (A * B) ^ (1/2). Label resultatet "denom."

Beregn korrelationskoefficienten, "r." Værdien af ​​"r" er lig med "num" divideret med "denom", som kan skrives som num /denom.

Standardiser dataene og skriv LSRL

Find midlerne til x-værdierne og y-værdierne. Tilføj alle x-værdierne sammen og divider resultatet med "n." Ring til dette "mx." Gør det samme for y-værdierne, og kald resultatet "min."

Find standardafvigelserne for x-værdierne og y-værdierne. Opret nye sæt data for x'erne og y'erne ved at subtrahere gennemsnittet for hvert datasæt fra de tilhørende data. For eksempel vil hvert datapunkt for x, "xdat" blive "xdat - mx." Firkant de resulterende datapunkter. Tilføj resultaterne for hver gruppe (x og y) separat, dividere med "n" for hver gruppe. Tag kvadratroden af ​​disse to endelige resultater for at give standardafvigelsen for hver gruppe. Kald standardafvigelsen for x-værdierne "sdx" og den for y-værdierne "sdy."

Standardiser dataene. Træk gennemsnitet for x-værdierne fra hver x-værdi. Opdel resultaterne med "sdx." De resterende data er standardiseret. Ring til disse data "x_". Gør det samme for y-værdierne: træk "min" fra hver y-værdi, dividerende med "sdy" som du går sammen. Kald disse data "y_".

Skriv regressionslinjen. Skriv "y_ ^ = rx_", hvor "^" er repræsentativ for "hat" - en forudsagt værdi - og "r" svarer til den korrelationskoefficient, der blev fundet tidligere.