Videnskab
 science >> Videnskab >  >> Andet

Tal i nyhederne? Sørg for, at du ikke falder for disse 3 statistiske tricks

Hvis det virker for godt til at være sandt, måske er det. Kredit:szefei/Shutterstock.com

"En praktisk smule forskning finder ud af, at seksualitet kan bestemmes af længden af ​​folks fingre" var en nylig overskrift baseret på en peer-reviewet undersøgelse af velrenommerede forskere ved University of Essex offentliggjort i Archives of Sexual Behavior, den førende videnskabelige publikation inden for menneskelig seksualitet.

Og, for mit statskyndige øje, det er en flok svineri.

Lige når det ser ud til, at nyhedsforbrugere måske er ved at blive kloge – husk at spørge, om videnskaben er "peer-reviewed, "stikprøvestørrelsen er stor nok, eller hvem der har finansieret arbejdet – sammen kommer der en snert af en historie. I dette tilfælde, den hurtige kommer i form af konfidensintervaller, et statistisk emne, som ingen lægmand egentlig nogensinde skulle skulle vade igennem for at forstå en nyhedsartikel.

Men, desværre for alle talhadere derude, hvis du ikke vil narre af åndenød, overhypet eller på anden måde værdiløs forskning, vi er nødt til at tale om et par statistiske principper, der stadig kan falde dig i fare, selv når alle de "legitime undersøgelser"-felter er afkrydset.

Hvad er min reelle risiko?

En af de mest deprimerende overskrifter, jeg nogensinde har læst, var "Otteårig undersøgelse viser, at tunge pommes frites-spisere har 'dobbelt' chancen for at dø." "Øh, " sagde jeg højt, nipper til mit glas rødvin med en stor ole-kurv med perfekt gyldne pommes frites foran mig. Virkelig?

Godt, Ja, det er sandt ifølge en peer-reviewed undersøgelse offentliggjort i American Journal of Clinical Nutrition . At spise pommes frites fordobler din risiko for død. Men, hvor mange pommes frites, og desuden, hvad var min oprindelige risiko for død?

Undersøgelsen siger, at hvis du spiser stegte kartofler tre gange om ugen eller mere, du vil fordoble din risiko for død. Så lad os tage en gennemsnitlig person i denne undersøgelse:en 60-årig mand. Hvad er hans risiko for død, uanset hvor mange pommes frites han spiser? En procent. Det betyder, at hvis du opstiller 100 60-årige mænd, mindst én af dem vil dø inden for det næste år, blot fordi han er en 60-årig mand.

Nu, hvis alle 100 af disse mænd spiser stegte kartofler mindst tre gange om ugen hele deres liv, Ja, deres risiko for død fordobles. Men hvad er 1 procent fordoblet? To procent. Så i stedet for at en af ​​de 100 mænd dør i løbet af året, to af dem vil. Og de kommer til at spise stegte kartofler tre gange om ugen eller mere hele deres liv – det lyder som en risiko, jeg er villig til at tage.

Dette er et statistisk begreb kaldet relativ risiko. Hvis chancen for at få en eller anden sygdom er 1 ud af en milliard, selvom du firdobler din risiko for at komme ned med det, din risiko er stadig kun 4 i en milliard. Det kommer ikke til at ske.

Så næste gang du ser en stigning eller et fald i risiko, det første spørgsmål du bør stille er "en stigning eller et fald i risiko fra hvilken oprindelig risiko."

Plus, ligesom mig, kunne de mænd have nydt et glas vin eller en halv liter øl med deres stegte kartofler? Kan noget andet rent faktisk have været synderen?

At spise ost før sengetid er lig med at dø af sammenfiltrede sengetøj?

Babyæsker er blevet en trendy statssponsoreret gave til nybagte forældre, beregnet til at give nyfødte et sikkert sted at sove. Initiativet voksede fra en finsk indsats startet i slutningen af ​​1930'erne for at reducere søvnrelateret død hos spædbørn. Papkassen indeholder et par væsentlige ting:nogle bleer, vådservietter, en onesie, ammeindlæg og så videre.

Finlands spædbørnsdødelighed faldt hurtigt med introduktionen af ​​disse babyæsker, og landet har nu en af ​​de laveste spædbørnsdødeligheder i verden. Så det giver mening at antage, at disse babyæsker fik børnedødeligheden til at falde.

Men gæt hvad der også ændrede sig? Prænatal pleje. For at kvalificere sig til babyboksen, en kvinde skulle besøge sundhedsklinikker i løbet af de første fire måneder af hendes graviditet.

I 1944, 31 procent af de finske mødre modtog prænatal undervisning. I 1945, den var sprunget til 86 procent. Babyboksen var ikke ansvarlig for ændringen i spædbørnsdødelighed; hellere, det var uddannelse og tidlige sundhedstjek.

Dette er et klassisk tilfælde af, at korrelation ikke er det samme som årsagssammenhæng. Introduktionen af ​​babyæsker og faldet i spædbørnsdødelighed er relateret, men det ene forårsagede ikke det andet.

Imidlertid, den lille kendsgerning har ikke forhindret babyboksvirksomheder i at dukke op til venstre, højre og midterste, sælger ting som "Baby Box Bundle:Finland Original" for kun 449,99 USD. Og amerikanske stater bruger skattekroner til at dele en version ud til nybagte mødre.

Så næste gang du ser et link eller en association – som hvordan det at spise ost er forbundet med at dø ved at blive viklet ind i dine sengetøj – bør du spørge "Hvad ellers kunne være årsagen til det?"

Når fejlmarginen er større end effekten

De seneste tal fra Bureau of Labor Statistics viser, at den nationale arbejdsløshed faldt fra 3,9 procent i august til 3,7 procent i september. Ved opstilling af disse tal, bureauet går åbenbart ikke rundt og spørger alle, om de har et arbejde eller ej. Den spørger et lille udsnit af befolkningen og generaliserer derefter arbejdsløsheden i denne gruppe til hele USA.

Det betyder, at det officielle arbejdsløshedsniveau på et givet tidspunkt er et skøn – et godt gæt, men stadig et gæt. Denne "plus eller minus fejl" er defineret af noget statistikere kalder et konfidensinterval.

Hvad dataene faktisk siger er, at det ser ud til, at antallet af ledige på landsplan er faldet med 270, 000 – men med en fejlmargin, som defineret af konfidensintervallet, på plus eller minus 263, 000. Det er nemmere at annoncere et enkelt tal som 270, 000. Men sampling kommer altid med en fejlmargin, og det er mere præcist at tænke på det enkelte estimat som et interval. I dette tilfælde, statistikere mener, at det reelle antal arbejdsløse faldt med et sted mellem kun 7, 000 i den lave ende og 533, 000 i den høje ende.

Dette er det samme problem, som skete med fingerlængden, der definerer seksualitetsundersøgelsen - plus- eller minusfejlen forbundet med disse estimater kan simpelthen ophæve enhver sikkerhed i resultaterne.

Det mest oplagte eksempel på konfidensintervaller, der gør vores liv forvirrende, er afstemning. Meningsmålingerne tager et udsnit af befolkningen, spørg, hvem den prøve vil stemme på, og så udlede af det, hvad hele befolkningen skal gøre på valgdagen. Når løbene er tætte, plus- eller minusfejlen forbundet med deres afstemninger af stikprøven afkræfter enhver reel viden om, hvem der skal vinde, gør løbene "for tæt på at kalde."

Så næste gang du ser et tal blive angivet om en hel befolkning, hvor det ville have været umuligt at spørge hver enkelt person eller teste hvert enkelt emne, du bør spørge om plus eller minus fejl.

Vil kendskab til disse tre aspekter af statistiske vildledninger betyde, at du aldrig bliver narre? Nix. Men de vil helt sikkert hjælpe.

Denne artikel er genudgivet fra The Conversation under en Creative Commons-licens. Læs den originale artikel.




Varme artikler