Bias er fejlen i estimater på grund af systematiske fejl, der fører til konsekvent høje eller lave resultater i forhold til de faktiske værdier. Den individuelle bias af et skøn, der vides at være forspændt, er forskellen mellem de estimerede og faktiske værdier. Hvis estimatet ikke er kendt for at være forudindtaget, kan forskellen også skyldes tilfældig fejl eller andre unøjagtigheder. I modsætning til bias, som altid virker i en retning, kan disse fejl være positive eller negative.
For at beregne bias af en metode anvendt til mange estimater, find fejlene ved at trække hvert estimat fra den aktuelle eller observerede værdi . Tilføj alle fejlene op og divider med antallet af estimater for at få bias. Hvis fejlene fylder op til nul, var estimaterne upartiske, og metoden leverer upartiske resultater. Hvis estimaterne er forspændte, kan det være muligt at finde kilden til forspændingen og eliminere den for at forbedre metoden.
TL; DR (for lang tid, ikke læst)
Beregn bias ved at finde forskellen mellem et estimat og den faktiske værdi. For at finde bias af en metode, udfør mange estimater, og tilføj fejlene i hvert estimat i forhold til den reelle værdi. Opdeling efter antallet af estimater giver forskydningen af metoden. I statistikker kan der være mange estimater for at finde en enkelt værdi. Bias er forskellen mellem gennemsnittet af disse estimater og den faktiske værdi.
Sådan fungerer Bias
Når estimater er forspændte, er de konsekvent forkerte i en retning på grund af fejl i systemet, der anvendes til anslår. For eksempel kan en vejrudsigt konsekvent forudsige temperaturer, der er højere end de faktisk observerede. Prognosen er forudindtaget, og et sted i systemet er der en fejl, der giver for højt estimat. Hvis prognosemetoden er upartisk, kan den stadig forudsige temperaturer, der ikke er korrekte, men de forkerte temperaturer vil nogle gange være højere og nogle gange lavere end de observerede temperaturer.
Statistisk bias fungerer på samme måde, men er normalt baseret på et stort antal skøn, undersøgelser eller prognoser. Disse resultater kan grafisk repræsenteres i en fordelingskurve, og bias er forskellen mellem middelværdien af fordelingen og den faktiske værdi. Hvis der er bias, vil der altid være en forskel, selvom nogle individuelle estimater kan falde hver side af den faktiske værdi.
Bias i undersøgelser
Et eksempel på bias er et undersøgelsesselskab, der kører afstemninger i valgkampagner, men deres afstemningsresultater overvurderer konsekvent resultaterne for et politisk parti i forhold til de faktiske valgresultater. Forspørgslen kan beregnes for hvert valg ved at trække det faktiske resultat fra afstemningsprognosen. Den gennemsnitlige bias af den anvendte valgmetode kan beregnes ved at finde gennemsnittet af de enkelte fejl. Hvis forspørgslen er stor og konsekvent, kan afstemningsfirmaet forsøge at finde ud af, hvorfor deres metode er forspændt.
Bias kan komme fra to hovedkilder. Enten er udvælgelsen af deltagere til afstemningen forspændt, eller forspændingen skyldes fortolkningen af de modtagne oplysninger fra deltagerne. For eksempel er internetundersøgelser formentlig forudindtaget, fordi de deltagere, der udfylder internetformularerne, ikke er repræsentative for hele befolkningen. Dette er et valg bias.
Polling selskaber er opmærksomme på dette valg bias og kompensere ved at justere tallene. Hvis resultaterne stadig er forspændte, er det en informationsforskel, fordi virksomhederne ikke fortolker oplysningerne korrekt. I alle disse tilfælde viser en biasberegning, i hvilket omfang de estimerede værdier er nyttige, og når metoderne skal justeres.
Sidste artikelSådan beregnes Bond Energy
Næste artikelHvad betyder ionisering Energimåling?