Videnskab
 science >> Videnskab >  >> Math

Sådan beregnes SSE

Når du passer en lige linje til et sæt data, kan du være interesseret i at bestemme, hvor godt den resulterende linje passer til dataene. En måde at gøre dette på er at beregne summen af ​​kvadraterfejl (SSE). Denne værdi giver et mål for, hvor godt linien med bedst egnet tilnærmelse til datasættet. SSE er vigtig for analysen af ​​eksperimentelle data og bestemmes gennem kun få korte trin.

Find en linje med den bedste pasform til at model dataene ved hjælp af regression. Linien med den bedste pasform har formen y = ax + b, hvor a og b er parametre, som du skal bestemme. Du kan finde disse parametre ved hjælp af en simpel lineær regressionsanalyse. Antag for eksempel, at den bedst egnede linje har formen y = 0.8x + 7.

Brug ligningen til at bestemme værdien af ​​hver y-værdi forudsagt af den bedst egnede linje. Du kan gøre dette ved at erstatte hver x-værdi i ligningens ligning. For eksempel, hvis x er lig med 1, erstatter det i ligningen y = 0,8x + 7 giver 7,8 for y-værdien.

Bestem middelværdien af ​​de forudsagte værdier fra linien med den bedste pasformsligning. Du kan gøre dette ved at opsummere alle de y-værdier, der forudsiges fra ligningerne, og dividere det resulterende tal med antallet af værdier. Hvis værdierne f.eks. Er 7,8, 8,6 og 9,4, giver summen af ​​disse værdier 25,8 og deler dette tal med antallet af værdier, 3 i dette tilfælde giver 8,6.

Subtraher hver enkelt værdi fra den gennemsnitlige og firkantede det resulterende tal. I vores eksempel, hvis vi trækker værdien 7,8 fra middelværdien 8,6, er det resulterende tal 0,8. Kvadrering af denne værdi giver 0,64.

Sum alle de kvadratiske værdier fra trin 4. Hvis du anvender instruktionerne i trin 4 til alle tre værdier i vores eksempel, finder du værdier på 0,64, 0 og 0,64. Summen af ​​disse værdier giver 1,28. Dette er summen af ​​kvadraterfejl.

Advarsel

Tallene fra dataene bruges kun til at bestemme ligningen for den linje, der passer bedst til. Brug værdier fra den bedst egnede linje, når du beregner summen af ​​kvadraterfejl.