Et af de mest basale værktøjer til teknisk eller videnskabelig analyse er lineær regression. Denne teknik starter med et datasæt i to variabler. Den uafhængige variabel kaldes normalt "x", og den afhængige variabel kaldes normalt "y." Målet med teknikken er at identificere linjen, y \u003d mx + b, der tilnærmer sig datasættet. Denne trendlinje kan grafisk og numerisk vise forhold mellem de afhængige og uafhængige variabler. Fra denne regressionsanalyse beregnes også en værdi for korrelation.
Identificer og adskill x og y-værdierne for dine datapunkter. Hvis du bruger et regneark, skal du indtaste dem i tilstødende kolonner. Der skal være det samme antal x- og y-værdier. Hvis ikke, er beregningen unøjagtig, eller regnearksfunktionen returnerer en fejl. x \u003d (6, 5, 11, 7, 5, 4, 4) y \u003d (2, 3, 9, 1, 8, 7, 5)
Beregn gennemsnitsværdien for x-værdierne og y-værdier ved at dividere summen af alle værdier med det samlede antal værdier i sættet. " og y_avg. "X_avg \u003d (6 + 5 + 11 + 7 + 5 + 4 + 4) /7 \u003d 6 y_avg \u003d (2 + 3 + 9 + 1 + 8 + 7 + 5) /7 \u003d 5
Opret to nye datasæt ved at trække x_avg-værdien fra hver x-værdi og y_avg-værdien fra hver y-værdi. X1 \u003d (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 \u003d (0, -1, 5, 1, -1, -2, -2) y1 \u003d (2 - 5, 3 - 5, 9 - 5, 1 - 5, ... ) y1 \u003d (-3, -2, 4, -4, 3, 2, 0)
Multiplikér hver x1-værdi med hver y1-værdi, i rækkefølge. x1y1 \u003d (0 * -3, -1 * -2, 5 * 4, ...) x1y1 \u003d (0, 2, 20, -4, -3, -4, 0)
Kvadratisk hver x1 værdi. X1 ^ 2 \u003d (0 ^ 2 , 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 \u003d (0, 1, 25, 1, 1, 4, 4)
Beregn summen af x1y1-værdierne og x1 ^ 2 værdier. sum_x1y1 \u003d 0 + 2 + 20 - 4 - 3 - 4 + 0 \u003d 11 sum_x1 ^ 2 \u003d 0 + 1+ 25 + 1 + 1 + 4 + 4 \u003d 36
Del "sum_x1y1" med " sum_x1 ^ 2 "for at få regressionskoefficienten. sum_x1y1 /sum_x1 ^ 2 \u003d 11/36 \u003d 0.306
Tips
For dem, der foretrækker at arbejde direkte med ækv uation, det er m \u003d sum [(x_i - x_avg) (y_i - y_avg)] /sum [(x_i - x_avg) ^ 2].
Mange regneark har forskellige lineære regressionsfunktioner. "Hældning" -funktionen til at tage gennemsnittet af x- og y-kolonnerne, og regnearket udfører automatisk alle de resterende beregninger.
Sidste artikelSådan beregnes Resterende procent
Næste artikelSådan beregnes et gentagelsesinterval