Videnskab
 science >> Videnskab >  >> Andet

Sådan finder du ligningen mellem et spredningsdiagram

Et scatter-plot er en graf, der viser forholdet mellem to datasæt. Nogle gange er det nyttigt at bruge dataene inde i et scatter-plot for at opnå et matematisk forhold mellem to variabler. Ligningen af et scatter-plot kan opnås manuelt ved hjælp af en af to hovedmåder: en grafisk teknik eller en teknik kaldet lineær regression. . Tegn x- og y-akserne, og sørg for, at de skærer og mærker oprindelsen. Sørg for, at x- og y-akserne også har korrekte titler. Derefter plot hvert datapunkt inden for grafen. Eventuelle tendenser mellem de afbildede datasæt skal nu være tydelige.
Line of Best Fit

Når et scatter-plot er blevet oprettet, hvis vi antager, at der er en lineær korrelation mellem to datasæt, kan vi bruge en grafisk metode for at opnå ligningen. Tag en lineal og træk en linje så tæt som muligt på alle punkterne. Forsøg at sikre, at der er så mange punkter over linjen, som der er under linjen. Når linjen er trukket, skal du bruge standardmetoder til at finde ligningen på den rette linje. Ligning af lige linje.

Når en linje med den bedste pasform er placeret på en spredningsgraf, er det ligetil at finde ligning. Den generelle ligning af en lige linje er:

y \u003d mx + c

Hvor m er linjens hældning (gradient) og c er y-skæringen. Find to punkter på linjen for at få gradienten. Lad os antage, at de to punkter er (1,3) og (0,1) for dette eksempel. Gradienten kan beregnes ved at tage forskellen i y-koordinaterne og dividere med forskellen i x-koordinaterne:

m \u003d (3 - 1) /(1 - 0) \u003d 2/1 \u003d 2

Gradienten i dette tilfælde er lig med 2. Hidtil er ligningen på den lige linje

y \u003d 2x + c

Værdien for c kan opnås ved at erstatte værdierne med et kendt punkt. Efter eksemplet er et af de kendte punkter (1,3). Sæt dette i ligningen og omarrangerer for c:

3 \u003d (2 * 1) + c

c \u003d 3 - 2 \u003d 1

Den endelige ligning i dette tilfælde er:

y \u003d 2x + 1 - Lineær regression

Lineær regression er en matematisk metode, der kan bruges til at opnå den lige linje ligning af et scatter plot. Start med at placere dine data i en tabel. Lad dette eksempel antage, at vi har følgende data:

(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)

Beregn summen af x-værdierne:

x_sum \u003d 4.1 + 6.5 + 12.6 \u003d 23.2

Beregn derefter summen af y-værdierne:

y_sum \u003d 2.2 + 4.4 + 10.4 \u003d 17

Nu summeres produkterne fra hvert datapunktsæt:

xy_sum \u003d (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) \u003d 168.66

Næste, beregne summen af de kvadratiske x-værdier og y-værdierne i kvadratet:

x_square_sum \u003d (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) \u003d 217.82

y_square_sum \u003d (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) \u003d 133.25

Til sidst tæller det antal datapunkter, du har. I dette tilfælde har vi tre datapunkter (N \u003d 3). Gradienten for linjen med den bedste pasform opnås fra:

m \u003d (N * xy_sum) - (x_sum * y_sum) /(N * x_square_sum) - (x_sum * x_sum) \u003d (3 * 168.66) - (23.2 * 17) /(3 * 217.82) - (23.2 * 23.2) \u003d 0,968

Afskærmningen for den bedste fit line kan fås fra:

c \u003d (x_square_sum * y_sum) - (x_sum * xy_sum) /(N * x_square_sum) - (x_sum * x_sum)

\\ \u003d (217.82 17) - (23.2
168.66) /(3 * 217.82) - (23.2 * 23.2) \\ \u003d -1,82

Den endelige ligning er derfor:

y \u003d 0,968x - 1,82