Du ville nu tro, at vi utvetydigt kunne sige, hvad der forårsager hvad. Men spørgsmålet om årsag, som har hjemsøgt videnskab og filosofi fra deres tidligste dage, hunde stadig vores hæle af mange årsager. Mennesker har evolutionært en tendens til at se mønstre og er psykologisk tilbøjelige til at indsamle oplysninger, der understøtter allerede eksisterende synspunkter, et træk kendt som bekræftelsesforstyrrelse . Vi forveksler sammenfald med korrelation og korrelation med kausalitet.
For at A forårsager B, vi plejer at sige det, som minimum, A skal gå forud for B, de to skal covary (variere sammen), og ingen konkurrerende forklaring kan bedre forklare kovariansen mellem A og B. Taget alene, imidlertid, disse tre krav kan ikke bevise årsag; de er, som filosoffer siger, nødvendigt, men ikke tilstrækkeligt. Under alle omstændigheder, ikke alle er enige med dem.
Apropos filosoffer, David Hume hævdede, at årsagssammenhæng ikke findes i nogen beviselig forstand. Karl Popper og forfalskningspersoner fastholdt, at vi ikke kan bevise et forhold, modbeviser det kun, hvilket forklarer, hvorfor statistiske analyser ikke forsøger at bevise en sammenhæng; i stedet, de trækker en dobbelt negativ og modbeviser, at dataene er ukorrelerede, en proces kendt som afviser nulhypotesen .
Med sådanne overvejelser i tankerne, videnskabsfolk skal omhyggeligt designe og kontrollere deres eksperimenter for at udrydde bias, cirkulær begrundelse, selvopfyldende profetier og skjulte variabler. De skal respektere kravene og begrænsningerne i de anvendte metoder, trække fra repræsentative prøver, hvor det er muligt og ikke overdrive deres resultater.
Klar til at læse om 10 tilfælde, hvor det ikke var så let?
IndholdFolk er en smerte at forske i. De reagerer ikke kun på den stimulus, du studerer, men også på selve eksperimentet. Forskere i dag forsøger at designe eksperimenter til kontrol med sådanne faktorer, men sådan var det ikke altid.
Tag Hawthorne -værkerne i Cicero, Ill. I en række forsøg fra 1924-1932, forskere undersøgte arbejdernes produktivitetseffekter forbundet med at ændre Illinois fabriks miljø, herunder skiftende lysniveauer, rydde op på stedet og flytte arbejdsstationer rundt. Lige da de troede, at de var i gang med noget, de bemærkede et problem:De observerede produktivitetsstigninger markerede næsten, så snart forskerne forlod værkerne, hvilket angiver, at arbejdernes kendskab til eksperimentet ikke forskernes ændringer, havde sat gang i boostet. Forskere kalder stadig dette fænomen for Hawthorne -effekt .
Et beslægtet koncept, det John Henry -effekt , opstår, når medlemmer af en kontrolgruppe forsøger at slå forsøgsgruppen ved at sparke deres indsats i overdrive. De behøver ikke at vide om forsøget; de behøver kun at se en gruppe modtage nye værktøjer eller yderligere instruktioner. Som den legendariske stålkørende mand, de vil bevise deres evner og tjene respekt [kilder:Saretsky; Vogt].
Titelfigurerne i Tom Stoppards film "Rosencrantz og Guildenstern Are Dead" begynder filmen forvirret, forvirret og til sidst bange, da hver af 157 på hinanden følgende flips af en mønt kommer op i hovederne. Guildenstern's forklaringer på dette fænomen spænder fra tidsløjfer til "en spektakulær bekræftelse af princippet om, at hver enkelt mønt, spundet individuelt, er lige så tilbøjelig til at falde ned i hovedet som haler ... "
Evolution kablet mennesker til at se mønstre, og vores evne til korrekt at behandle den trang ser ud til at kortslutte, jo længere vi bruger spil. Vi kan rationelt acceptere, at uafhængige begivenheder som møntvendinger holder de samme odds, uanset hvor mange gange du udfører dem. Men vi ser også disse begivenheder, mindre rationelt, som striber, laver falske mentale korrelationer mellem randomiserede hændelser. Ser fortiden som optakt, Vi tænker hele tiden, at den næste vending burde være haler.
Statistikere kalder dette gambler's fejlslutning , aka den Fejl i Monte Carlo , efter et særligt illustrerende eksempel, der forekommer i den berømte ferieby i Monaco. I løbet af sommeren 1913 blev spillerne så i stigende forbløffelse på, hvordan et casinos roulettehjul landede på sort 26 gange i træk. Betændt af vished om, at rød skyldtes " "spillerne blev ved med at plunke deres chips ned. Kasinoet lavede en mynte [kilder:Lehrer; Oppenheimer og Monin; Vogt].
Ingen diskussion af striber, magisk tænkning eller falsk årsagssammenhæng ville være komplet uden at bladre gennem sportsiderne. Stjerne sportssæsoner opstår fra et så mystisk samspil mellem faktorer - naturlig evne, uddannelse, tillid, lejlighedsvis X -faktor - at vi forestiller os mønstre i præstationer, selvom undersøgelser gentagne gange afviser streak -skydning og "vellykkede" overtro som noget mere end imaginært.
Troen på striber eller nedslag indebærer, at succes "forårsager" succes og fiasko "forårsager" fiasko eller, måske mere rimeligt, den variation i en eller anden fælles faktor, såsom tillid, forårsager begge dele. Men undersøgelse efter undersøgelse formår ikke at vise dette [kilder:Gilovich et al .; Tversky og Gilovich]. Det samme gælder for overtro, selvom det ikke forhindrede Cleveland -indianernes Kevin Rhomberg i at nægte at dreje til højre, mens han var på banen, eller forhindre Ottawa Senators center Bruce Gardiner i at dunke sin hockeystick i toilettet for at bryde den lejlighedsvise nedtur [kilde:Trex].
Andet fald, også, typisk stammer fra et for godt første år. Præstationssvingninger har en tendens til at udjævnes i det lange løb, et fænomen, som statistikere kalder tilbagegang mod middelværdien . I sport, denne gennemsnitlige hjælp er hjulpet af oppositionen, som tilpasser sig den nye spillers vellykkede færdighedssæt.
Randomiserede kontrollerede forsøg er guldstandarden i statistik, men nogle gange - i epidemiologi, for eksempel - etiske og praktiske overvejelser tvinger forskere til at analysere tilgængelige sager. Desværre, sådan observationsstudier risikobeskæftigelse, skjulte variabler og, værst af alt, en studiegruppe, der muligvis ikke afspejler befolkningen som helhed. At studere en repræsentativ prøve er afgørende; det giver forskere mulighed for at anvende resultater på mennesker uden for undersøgelsen, ligesom os andre.
Et godt eksempel:hormonbehandling (HRT). Udover behandling af symptomer forbundet med overgangsalderen, det blev engang hyldet for potentielt at reducere risikoen for koronar hjertesygdom (CHD), takket være en meget ballyhooed observationsstudie fra 1991 [kilde:Stampfer og Colditz]. Men senere randomiserede kontrollerede undersøgelser, herunder det store kvindesundhedsinitiativ, afslørede enten et negativt forhold, eller en statistisk ubetydelig, mellem HRT og CHD [kilder:Lawlor et al .; New York Times].
Hvorfor forskellen? For én ting, kvinder, der bruger HRT, har en tendens til at komme fra højere socioøkonomiske lag og modtage en bedre kvalitet af kost og motion - et skjult forklarende forhold, som observationsstudiet ikke fuldt ud kunne redegøre for [kilde:Lawlor et al.].
I 1978, sportsreporter og klummeskribent Leonard Koppett hånet forvirringen mellem årsagssammenhæng og korrelation ved skævt at antyde, at Super Bowl-resultater kunne forudsige aktiemarkedet. Det gav bagslag:Ikke alene troede folk på ham, men det virkede - med frygtelig frekvens.
Forslaget gik som følger:Hvis et af de 16 originale National Football League -hold - dem der eksisterede før NFL's fusion i 1966 med American Football League - vandt Super Bowl, aktiemarkedet ville lukke højere det følgende år end det gjorde den foregående 31. december. Hvis et tidligere AFL -hold vandt, det ville gå ned [kilder:Koppett; Koppett; Koppett; Koppett; Zweig].
Fra 1967 til 1978, Koppetts system gik 12 for 12; frem til 1997, det pralede en 95 procent succesrate. Det faldt i 1998 og 1999, da AFL alums vandt Denver Broncos og markedet steg [kilder:Koppett; Koppett; Koppett; Koppett].
Nogle har hævdet, at mønsteret eksisterer, drevet af tro; det virker, de siger, fordi investorer mener, at det gør det, eller fordi de tror, at andre investorer tror på det. Denne forestilling, skønt klogt på en regressiv måde, forklarer næppe de 12 års vellykkede sammenhænge, der var forud for Koppetts artikel. Andre hævder, at et mere relevant mønster ligger i aktiemarkedets store opadgående tendens, udelukker nogle kortsigtede større og mindre udsving, og det faktum, at et originalt NFL -hold vandt hver Super Bowl fra 1984 til 1998 [kilde:Norris].
Big data - processen med at lede efter mønstre i datasæt, der er så store, at de modstår traditionelle analysemetoder - vurderer stor brummer i bestyrelseslokalet i disse dage [kilde:Arthur]. Men er større altid bedre?
Det er en regel, der tromles ind i de fleste forskere i deres første statistikklasse:Når man støder på et hav af data, modstå trangen til at gå på en fiskeri ekspedition . Givet nok data, tålmodighed og metodisk spillerum, korrelationer er næsten uundgåelige, hvis det er uetisk og stort set ubrugeligt.
Trods alt, den blotte sammenhæng mellem to variabler indebærer ikke årsagssammenhæng; det gør den heller ikke, i mange tilfælde, peger på meget af et forhold. For én ting, forskere kan ikke bruge statistiske målinger af korrelation villy-nilly; hver indeholder visse antagelser og begrænsninger, som fiskeekspeditioner alt for ofte ignorerer, for ikke at sige noget om de skjulte variabler, prøveudtagningsproblemer og fejl i fortolkning, der kan tyggegummi en dårligt designet undersøgelse.
Indrømmet, big data har sine anvendelser. Lagerstyring trives med at opdage indkøbsmønstre, dog mystiske deres underliggende årsager. For at tage et lidt uhyggeligt eksempel, Target har brugt indkøbsmønstre til at identificere gravide kunder og derefter sende dem målrettede kuponer [kilder:Duhigg; Bakke; Taylor]. Så nyd det belønningskort - og 10 procent rabat på dine prænatale vitaminer - men forvent ikke for meget ud af big data i kausalitetsafdelingen.
Ethvert problem, der handler om penge, vil sandsynligvis være dybt splittende og stærkt politiseret, og mindstelønstigninger er ingen undtagelse. Argumenterne er forskellige og komplekse, men hovedsagelig hævder den ene side, at en højere mindsteløn skader virksomheder, hvilket reducerer tilgængeligheden af job, hvilket gør ondt på de fattige. Den anden side svarer, at der er ringe beviser for denne påstand, og at de 3,6 millioner amerikanere, der arbejder med eller under mindsteløn, som nogle hævder ikke er en levende løn, ville have fordel af en sådan stigning. De hævder, at justeret for inflation, den føderale mindsteløn ($ 7,25 pr. time i december 2013) har kælket ned ad bakke i de sidste 40 år [kilder:Bureau of Labor Statistics; Irwin].
Som George Bernard Shaw angiveligt spurgte, "Hvis alle økonomerne blev lagt ende på ende, de ville aldrig nå til en konklusion, "og mindsteløndebatten ser ud til at bære det ud [kilde:Ridgers. For hver analytiker, der siger, at mindstelønstigninger driver job væk, er der en anden, der argumenterer imod en sådan sammenhæng [kilder:Baskaya og Rubinstein; Card og Krueger].
Til sidst, begge sider deler et grundlæggende problem, nemlig, overflod af anekdotiske beviser mange af deres talende hoveder stoler på for at få støtte. Brugte historier og kirsebærplukkede data giver svag te til enhver fest, selv når de præsenteres i smukke søjlediagrammer.
Mellem bøger, medicin og operationer, vægttab i USA er en industri på 20 milliarder dollar om året, med 108 millioner amerikanere, der bukker op til vægttabsstangen hvert år [kilde:ABC News]. Ikke overraskende, vægttab undersøgelser - godt, dårligt eller grimt - få meget presse i USA
Tag den populære idé om, at spise morgenmad slår fedme, en sukkerfrost guldklump afledt af to hovedundersøgelser:Den ene, et randomiseret, kontrolleret studie fra Vanderbilt University fra 1992, viste, at vende normale morgenmadsvaner, om ved at spise eller ikke spise, korreleret med vægttab; den anden, en observationsundersøgelse fra 2002 foretaget af National Weight Control Registry, korreleret morgenmadsspisning med succesrige vægttabere-hvilket ikke er det samme som at korrelere det med vægttab [kilder:Brown et al .; O'Connor; Schlundt et al .; Wyatt et al.].
Desværre, NWCR -undersøgelsen kunne ikke kontrollere andre faktorer - eller Ja, etablere enhver årsagssammenhæng ud fra dens korrelation. For eksempel, en person, der ønsker at tabe sig, kan træne mere, eller spise morgenmad, eller gå fuld-protein, men uden et eksperimentelt design, der er i stand til at ringe i årsagssammenhænge, sådan adfærd udgør ikke andet end almindeligt forekommende egenskaber [kilder:Brown et al .; O'Connor].
Et lignende problem plager de mange undersøgelser, der forbinder familiemiddage med en reduceret risiko for stofmisbrug for teenagere. Selvom de er attraktive for deres enkle, tiltalende strategi, disse undersøgelser ofte undlader at kontrollere for relaterede faktorer, såsom stærke familieforbindelser eller dybt forældrenes engagement i et barns liv [kilde:Bialik].
Vi hører ofte det bandied om, at mænd, især unge mænd, er mere tilbøjelige til at begå selvmord end kvinder. I sandhed, sådanne udsagn deltager i empirisk generalisering - handlingen med at komme med en bred erklæring om et fælles mønster uden at forsøge at forklare det- og maskere en række kendte og potentielle forvirrende faktorer.
Tage, for eksempel, det faktum, at kvinder gør tre gange så mange selvmordsforsøg som mænd. Hvordan kan der så eksistere en højere sammenhæng mellem det modsatte køn og selvmord? Svaret ligger i succesraten, påvirket af forskelle i metodologi:Kvinder ty til piller, mens mænd har en tendens til at favorisere våben [kilde:O'Connell].
Selvom vi kunne afskaffe sådanne forvirrende faktorer, faktum ville forblive den mandlighed, i sig selv, er ikke en årsag. For at forklare tendensen, vi skal i stedet identificere faktorer, der er fælles for mænd, eller i det mindste selvmord. Det samme punkt gælder for de forholdsvis høje selvmordsrater, der er rapporteret blandt fraskilte mænd. Skilsmisse får ikke mænd til at begå selvmord; hvis noget, årsagsvariablen gemmer sig blandt relaterede faktorer, såsom isolation, depression, en følelse af afmagt, økonomisk stress eller tab af forældremyndighed [kilder:Kposowa; Kposowa; Reuters].
Ingen liste over sammenhænge/årsagssammenhæng ville være komplet uden at drøfte forældrenes bekymringer over vaccinationssikkerhed, forankret i ideen, populariseret af berømtheder som Jenny McCarthy, den mæslinger, fåresyge og røde hunde (MMR) vaccinationer er årsagssammenhængende med autismespektrumforstyrrelser. På trods af at det medicinske samfund debunkede Andrew Wakefield -papiret fra 1998, der inspirerede ideen, og på trods af efterfølgende undersøgelser, der ikke viste nogen årsagssammenhæng, selv ved flere vaccinationer, nogle forældre er stadig bange for en autisme-forbindelse eller andre vaccinerelaterede farer [kilder:The Lancet; Parkere; Sifferlin; Szabo].
Selvom det er rigtigt, at ingen vaccine er 100 procent harmløs, troen på denne årsagssammenhæng stammer hovedsageligt fra naturlig forældres bekymring, belastet af forvirring, drevet af anekdotiske beviser og påvirket af bekræftelsesforstyrrelse , eller "hvis jeg ikke havde troet på det, havde jeg ikke set det." Yderligere næring til forvirringen er det faktum, at forældre og læger har en tendens til at genkende autismesymptomer sent, i alderen, at børn modtager mange vaccinationer. I virkeligheden, Autismens begyndelse er ret kompleks og følger mere end et mønster. Ja, undersøgelser viser nu, at begyndelsen kan begynde så tidligt som 6-12 måneder [kilder:CDC; Johnson og Schultz; Mandell et al .; NIH; Ozonoff et al.].
Det er ingen harmløs misforståelse. I 2011, Time magazine rapporterede, at 13 procent af forældrene sprang over, forsinket eller opdelt deres børns vaccinationer i nogle landdistrikter, det tal skød op til mellem 20 og 50 procent. I mellemtiden, 15 år efter denne panik begyndte, medicinske centre rapporterede om udbrud af kighoste og mæslinger. Om den korrespondance er tilfældig, korrelativ eller kausal er værd at overveje [kilder:O'Connor; Parkere; Parkere].
Oprindeligt udgivet:23. dec. 2013
Så meget som jeg afskyr dårligt eksperimentelt design, blind tillid til statistik og sensationel videnskabelig rapportering, det er værd at nævne, at stærke sammenhænge, men ikke alene tilstrækkelig til at bevise årsag, peger ofte på områder, der er værd at undersøge. Klart, med "korrelationer" mener jeg ikke autokorrelationer, forvirrende variabler eller andre artefakter af dårligt design eller dårligt forståede metodiske krav og begrænsninger alligevel, måske kan Internettet afskaffe sloganet "korrelation betyder ikke årsagssammenhæng" lidt, eller i det mindste vokse lidt mere selektive i sin anvendelse.
Sidste artikel10 forskelle mellem Moonshining og Homebrewing
Næste artikel10 videnskabelige eksperimenter at lave i sneen