Når et sæt data indeholder to variabler, der kan relateres, såsom højder og vægte af individer, finder regressionsanalyse en matematisk funktion, der bedst tilnærmes forholdet. Summen af rester er et mål for, hvor godt et job funktionen gør.
Residualer
I regressionsanalyse vælger vi en variabel for at være "forklarende variabel", som vi vil kalde x , og den anden er "responsvariablen", som vi vil kalde y. Regressionsanalyse skaber funktionen y = f (x), der bedst forudsiger svarvariablen fra den tilhørende forklarende variabel. Hvis x [i] er en af de forklarende variabler, og y [i] sin responsvariabel, så er resten den fejl eller forskel mellem den faktiske værdi af y [i] og den forudsagte værdi af y [i]. Med andre ord, rest = y [i] - f (x [i]).
Eksempel
Et sæt data indeholder højderne i centimeter og vægte i kilo på 5 personer: [ ,null,null,3],(152,54), (165,65), (175,100), (170,80), (140, 45)]. En kvadratisk vægtvægt, w, for højde, h, er w = f (h) = 1160 -15,5_h + 0,054_h ^ 2. Resterne er (i kg): [2,38, 7,65, 1,25, 5,60, 3,40]. Summen af rester er 15,5 kg.
Lineær regression
Den enkleste form for regression er lineær regression, hvor den matematiske funktion er en ret linje af formen y = m * x + b . I dette tilfælde er summen af restkoncentrationer 0 pr. Definition.
Sidste artikelSådan beregnes medianændring
Næste artikelSådan konverteres en division til en fraktion