Videnskab
 science >> Videnskab >  >> Math

Sådan finder du linjære funktioner

På et eller andet tidspunkt har du sikkert brugt regnearkprogrammer til at finde den bedste lineære ligning, der passer til et givet sæt datapunkter - en operation kaldet simpel lineær regression. Hvis du nogensinde har spekuleret på, hvordan regnearksprogrammet fuldender beregningen, så rolig, det er ikke magisk. Du kan faktisk finde den linje, der passer dig bedst uden et regnearksprogram ved blot at tilslutte tal ved hjælp af din regnemaskine. Desværre er formlen kompliceret, men den kan opdeles i nemme, håndterbare trin.

Forbered dataene

Kompilér dine data i en tabel. Skriv x-værdierne i en kolonne og y-værdier i en anden. Bestem, hvor mange rækker, f.eks. Hvor mange datapunkter eller x, y værdier du har i din tabel.

Tilføj to yderligere kolonner i tabellen. Udpeg en kolonne som "x kvadreret" og den anden som "xy" for x gange y.

Udfyld x-kvadreret kolonne ved at gange hver værdi af x gange selv eller kvadrere den. For eksempel er 2 kvadreret 4, fordi 2 x 2 = 4.

Udfyld xy-kolonnen ved at gange hver værdi af x mod den tilsvarende værdi af y. Hvis x er 10 og y er 3, så 10 x 3 = 30.

Tilføj alle tallene i x-kolonnen, og skriv summen nede i bunden af ​​x-kolonnen. Gør det samme for de andre tre kolonner. Du vil nu bruge disse summer til at finde en lineær funktion af formen y = Mx + B, hvor M og B er konstanter.

Find M

Multiplicer antallet af point i dit datasæt ved summen af ​​xy-kolonnen. Hvis summen af ​​xy-søjlen er 200, og antallet af datapunkter er 10, ville resultatet være 2000.

Multiplicér summen af ​​x-søjlen med summen af ​​y-kolonnen. Hvis summen af ​​x-søjlen er 20, og summen af ​​y-søjlen er 100, vil dit svar være 2000.

Træk resultatet i trin 2 fra resultatet i trin 1. I eksemplet ville dit resultat være 0.

Multiplicer antallet af datapunkter i dit datasæt ved summen af ​​den x-kvadratiske kolonne. Hvis dit antal datapunkter er 10, og summen af ​​din x-kvadreret kolonne er 60, vil dit svar være 600.

Firkant summen af ​​x-søjlen og trækker den fra dit resultat i trin 4. Hvis summen af ​​x-søjlen er 20, 20 squared vil være 400, så 600-400 er 200.

Opdel dit resultat fra Trin 3 med dit resultat fra Trin 5. I eksemplet vil resultatet være 0 , da 0 divideret med et hvilket som helst tal er 0. M = 0.

Find B og Løs ligningen

Multiplicér summen af ​​x-kvadreret kolonne med summen af ​​y-kolonnen. I eksemplet er summen af ​​x-kvadreret søjle 60 og summen af ​​y-søjlen er 100, så 60 x 100 = 6000.

Multiplicér summen af ​​x-søjlen med summen af ​​xy kolonne. Hvis summen af ​​x-søjlen er 20, og summen af ​​xy-søjlen er 200 så 20 x 200 = 4000.

Træk dit svar i trin 2 fra dit svar i trin 1: 6000 - 4000 = 2000.

Multiplicer antallet af datapunkter i dit datasæt ved summen af ​​den x-kvadratiske kolonne. Hvis dit antal datapunkter er 10, og summen af ​​din x-kvadreret kolonne er 60, vil dit svar være 600.

Firkant summen af ​​x-søjlen og trækker den fra dit resultat i trin 4. Hvis summen af ​​x-søjlen er 20, så vil 20 kvadreret være 400, så 600-400 er 200.

Del dit resultat fra trin 3 med dit resultat fra trin 5. I dette eksempel ville 2000/200 være 10, så du ved nu, at B er 10.

Skriv ud den lineære ligning, du har afledt ved at bruge formularen y = Mx + B. Indsæt de værdier, du har beregnet for M og B. I Eksempel M = 0 og B = 10, så y = 0x + 10 eller y = 10.

Tip

Er du nysgerrig efter at vide, hvordan den formel du lige har brugt er afledt? Det er faktisk ikke så svært, som du måske tror, ​​selvom det indebærer nogle beregninger (delvise derivater). Det første link under afsnittet Referencer vil give dig et indblik i, om du er interesseret.

Mange grafiske regnemaskiner og regnearksprogrammer er designet til automatisk at beregne lineære regressionsformler til dig, selvom de trin du skal bruge til at få din regnearksprogram /grafikberegner til udførelse af denne operation afhænger af modellen /mærket. Se brugsanvisningen for instruktioner.

Advarsel

Bemærk at den formel du har afledt er en linje, der passer bedst til. Det betyder ikke, at det vil passere gennem hvert enkelt datapunkt - faktisk er det usandsynligt, at det vil. Det vil dog være den bedst mulige lineære ligning for det datasæt, du brugte.