Arytmi, en uregelmæssig rytme i hjertet, er almindelig under og kort efter et hjerteanfald og kan føre til tidlig død. Det var derfor, da antiarytmi-lægemidler blev tilgængelige i begyndelsen af 1980'erne, de virkede som et stort livreddende gennembrud [kilde:Freedman].
Problemet, selvom, var, at selvom småskala forsøg viste, at stofferne stoppede arytmi, stofferne reddede faktisk ikke liv. I stedet, som større undersøgelser viste, patienter, der modtog sådanne behandlinger, var en tredjedel mindre sandsynligvis overleve. Forskere havde fokuseret på at stoppe arytmi som et mål for effektivitet snarere end på det problem, de forsøgte at løse, som forhindrede dødsfald [kilder:Freedman, Hampton].
Hvorfor tog forskerne fejl? Som Discover magazine -forfatteren David H. Freedman forklarede i en artikel fra 2010, de forkerte konklusioner om antiarytmi-lægemidler er et eksempel på noget, der kaldes gadebelysningseffekt . Effekten er opkaldt efter den ordsproglige berusede, der forklarer, at han mistede sin tegnebog på tværs af gaden, men han leder efter gadelyset efter det, fordi lyset er bedre der. Tilsvarende i videnskab, der er en tendens til at se på og give større vægt til fænomener, der er lettere at måle - hvilket nogle gange kan resultere i en forkert konklusion.
Men gadebelysningseffekten er kun en af mange former for bias, der kan inficere videnskabelige undersøgelser og føre dem på vildspor. Forskere anser bias for at være et så stort problem, at de seneste år har det er blevet et genstand for forskning selv, hvor forskere bruger statistisk analyse og andre metoder til at finde ud af, hvor ofte det sker og hvorfor.
I denne artikel, vi ser på 10 af de mange former for bias, der kan påvirke resultaterne af videnskabelige og samfundsvidenskabelige undersøgelser, startende med en velkendt.
IndholdTilbage i 1903, få år efter opdagelsen af røntgenstråler af tyske forskere, en fransk videnskabsmand ved navn René Blondlot meddelte, at han havde opdaget endnu en tidligere ukendt form for stråling-N-stråler. De kunne kun observeres ved hjælp af perifert syn, og ses som en corona, da elektricitet blev afladet fra krystaller. Til sidst, Blondlots forskning blev tilbagevist af en amerikansk videnskabsmand, Robert Wood, der besøgte franskmandens laboratorium og fandt ud af, at Blondot stadig observerede N-stråler, selv efter at Wood i al hemmelighed fjernede krystallen under et af forsøgene.
Men efter det, der skete noget mærkeligt. Årevis, andre franske forskere fortsatte med at offentliggøre artikler, der beskriver deres observationer af N-stråler, som om de faktisk eksisterede. Måske af nationalistisk stolthed, Franske forskere ville se N-stråler, og det gjorde de [kilder:Lee, Simon].
Disse N-ray-fund var et ekstremt eksempel på en af de enkleste og mest anerkendte årsager til, at undersøgelser kan gå galt- bekræftelsesforstyrrelse . Det er, når en forsker tager hypotesen om, at han eller hun starter med ("marihuana er gavnligt/skadeligt") og former studiemetodikken eller analysen af dataene på en måde, der bekræfter den oprindelige forudsætning, om det faktisk er berettiget eller ej [kilde:Sarniak]. Lægfolk er også bytte for konfirmationsbias. Hvis de støtter (eller foragter) en siddende præsident i USA, for eksempel, de har en tendens til at lede efter oplysninger, der bekræfter deres opfattelse og ser bort fra alt, der afviser det.
Forskere, der har foretaget metaanalyser af videnskabelig forskning, har fundet ud af, at tidligt småskalaundersøgelser-dem der ofte citeres i andet arbejde-overvurderer ofte deres resultater [kilde:Fanelli, et al.].
Det kan ske pga prøveudtagning , hvor forskere, der foretager små undersøgelser, baserer deres fund på en gruppe, der ikke nødvendigvis er repræsentativ for den større befolkning. Universiteter bruger ofte studerende til deres studier, men resultaterne for denne gruppe projekterer ikke nødvendigvis til den bredere befolkning.
Det er et problem, der ses i både medicinstudier og samfundsvidenskabelig forskning. For eksempel, hvis en statsvidenskabelig forsker, der studerer holdninger til våbenkontrol, foretager undersøgelser i et område, hvor de fleste er tilhængere af andet ændringsforslag, der vil skæve resultaterne på en måde, der ikke nødvendigvis afspejler synspunkterne fra den større amerikanske befolkning.
Men stikprøveforskydning kan også forekomme i større undersøgelser. Et berømt eksempel på stikprøveforskydning fandt sted under den amerikanske præsidentkampagne i 1936, da Literary Digest foretog en mailundersøgelse blandt 2,4 millioner mennesker og forudsagde - forkert - at republikaneren Alf Landon let ville slå den siddende demokrat Franklin Roosevelt. Problemet var, at bladet brugte telefonbøger, chaufførers registreringer og country club -medlemskaber for at finde folk til at stemme - en metode, der havde en tendens til at nå relativt velhavende vælgere (biler og telefoner var luksusartikler dengang), frem for de fattigere, blandt hvem Roosevelt var populær. De fejlagtige resultater fremskyndede slutningen af publikationen [kilde:Oxford Math Center].
Hvordan afgør forskere, om et nyt lægemiddel vil helbrede eller hjælpe en bestemt sygdom? Normalt med en undersøgelse, der involverede to grupper mennesker. For eksempel, hvis forskerne studerer effektiviteten af et nyt antihistamin på allergikere, de ville give forsøgsmedicinen til den ene gruppe patienter og en placebo (sukkerpille) til den anden gruppe, kaldet kontrolgruppe . Ingen af grupperne formodes at vide, om de har fået medicinen, og undersøgelsesdeltagerne er tilfældigt tildelt hver gruppe.
Dette kaldes en randomiseret dobbeltblind placebokontrolundersøgelse og betragtes som guldstandarden for kliniske forsøg. "Dobbeltblind" refererer til det faktum, at hverken forskerne eller deltagerne ved, hvilke allergipatienter der er i hvilken gruppe, indtil efter forsøget er slut.
Der er flere grunde til at gøre dette, men en er at undgå udvælgelsesbias . Lad os sige, at du vil undersøge, om mennesker, der arbejder om natten, er mere tilbøjelige til at udvikle hovedpine. Så, du rekrutterer en gruppe mennesker, der arbejder om natten, og en anden gruppe, der arbejder i løbet af dagen, og sammenlign dem derefter. Dine resultater viser, at de mennesker, der arbejder om natten, er mere tilbøjelige til at have ondt i templerne.
Men det betyder ikke nødvendigvis, at natarbejde er årsagen, fordi det kan være, at folk, der arbejder om natten, har en tendens til at være fattigere, har mere usund kost eller mere stress. Sådanne faktorer kan forstyrre dine resultater, medmindre du kunne sikre dig, at de to grupper er ens på alle andre måder undtagen deres tidsplaner [kilder:Institute for Work and Health, CIRT].
Kanalisering af bias opstår, når en patients prognose eller sygdomsgrad påvirker, hvilken gruppe han eller hun bliver sat i i et studie. Det er et særligt problem i ikke -randomiserede medicinske forsøg, dem, hvor læger vælger, hvilke patienter der skal modtage det lægemiddel eller den kirurgiske procedure, der skal evalueres.
Det er ikke svært at finde ud af, hvorfor det sker, fordi læger, trods alt, generelt ønsker at hjælpe de mennesker, de behandler, og er uddannet til at afveje risici kontra fordelene ved en behandling.
Lad os se på et hypotetisk eksempel på en undersøgelse, der har til formål at evaluere effektiviteten af en bestemt kirurgisk procedure på hånden. Kirurger er måske mere tilbøjelige til at vælge yngre, sundere patienter til at få operationen, fordi de har lavere risiko for komplikationer bagefter, og mere et behov for at have fuld håndfunktion.
På tur, de er måske mindre tilbøjelige til at udføre det på ældre patienter, der står over for større postoperative risici og ikke behøver at have den samme grad af håndfunktion, fordi de ikke længere arbejder. Hvis forskere ikke er forsigtige, gruppen, der får operationen i undersøgelsen, vil bestå af yngre patienter, og den gruppe, der ikke gør det, vil for det meste være ældre. Det kunne give et meget andet resultat, end hvis de to grupper ellers var identiske [kilde:Pannucci og Wilkins].
Rækkefølgen, hvorpå der stilles spørgsmål i en undersøgelse eller undersøgelse, kan påvirke de svar, der gives. Det er fordi den menneskelige hjerne har en tendens til at organisere information i mønstre. De tidligere spørgsmål - især dem, der kommer lige før en bestemt forespørgsel - kan give oplysninger, som emner bruger som kontekst i formuleringen af deres efterfølgende svar, eller påvirke deres tanker, følelser og holdninger. Den effekt kaldes priming [kilder:Pew, Sarniak].
Pew Research gav dette eksempel fra en meningsmåling i december 2008:"Da folk blev spurgt 'Alt i alt, er du tilfreds eller utilfreds med den måde, det går på i dette land i dag? ' umiddelbart efter at være blevet spurgt 'Kan du godkende eller afvise den måde, George W. Bush håndterer sit job som præsident?'; 88 procent sagde, at de var utilfredse sammenlignet med kun 78 procent uden konteksten i det foregående spørgsmål. "
Et andet eksempel på spørgsmål-rækkefølge bias-effekten kommer fra General Social Survey, en større langsigtet undersøgelse af amerikanske holdninger. I 1984, GSS -deltagere blev bedt om at identificere de tre vigtigste kvaliteter for et barn at have, og givet et kort med en kvalitetsliste. Da "ærlig" var højt på listen, det blev valgt af 66 procent af respondenterne. Men da det nærmede sig slutningen, kun 48 procent af folk valgte det som en af deres top tre. Et lignende mønster blev set med andre kvaliteter [kilde:Henning].
Forskere skal ikke kun være forsigtige med, hvem de vælger at være i grupper i studier, men de skal også bekymre sig om, hvordan de beder om, registrere og fortolke de data, de får fra disse emner. Interviewer bias , som dette problem kaldes, er mere et problem i medicinske undersøgelser, når intervieweren kender forskerens sundhedsstatus, før han eller hun spørger ham.
En artikel i medicinsk tidsskrift fra 2010 om, hvordan man identificerer og undgår skævhed, citerer det hypotetiske eksempel på en undersøgelse, der forsøger at identificere risikofaktorer for Buergers sygdom, en sjælden lidelse, hvor arterier og vener i arme og ben bliver hævede og betændte. Hvis intervieweren allerede ved, at et forskningsemne har sygdommen, han eller hun vil sandsynligvis undersøge mere intensivt for kendte risikofaktorer, som at ryge. Så, intervieweren kan spørge folk i risikogruppen, "Er du sikker på, at du aldrig har røget? Aldrig? Ikke engang?" - mens du ikke udsatte patienter i kontrolgruppen for den slags spørgsmål [kilde:Pannucci og Wilkins].
En interviewer kan også forårsage fejlagtige resultater i en undersøgelse ved at give emner non-verbale tegn, når de stiller spørgsmål, f.eks. med fagter eller ansigtsudtryk, eller stemmetone [kilde:Delgado, et al.].
I undersøgelser, hvor folk bliver stillet spørgsmålstegn ved noget, der skete i fortiden, deres erindringer kan blive påvirket af den aktuelle virkelighed. Husk tilbøjelighed , som dette fænomen er kendt, kan være et stort problem, når forskere undersøger, hvilke faktorer der kunne have ført til en sundhedstilstand, og interviews er den vigtigste informationskilde. For eksempel, da der er en udbredt-omend ubegrundet-tro på, at autisme på en eller anden måde skyldes vaccinen mod mæslinger-fåresyge-røde hunde (MMR), forældre til børn på autismespektret er mere tilbøjelige til at huske, at deres barn blev immuniseret, før det viste tegn på autisme, og tegne en forbindelse mellem de to begivenheder [kilde:Pannucci og Wilkins].
Tilsvarende mødre til børn med fødselsdefekter kan være mere tilbøjelige til at huske medicin, de tog under graviditeten end mødre til fuldt udviklede børn. En undersøgelse viste også, at piloter, der vidste, at de havde været udsat for herbicidet Agent Orange, havde en større tendens til at huske hududslæt, som de oplevede året efter eksponering [kilde:Boston College].
Dette er en anden bias, der kan forekomme ved samfundsvidenskabelige undersøgelser. Folk vil være behagelige, så de er mere tilbøjelige til at svare bekræftende på et "ja/nej" eller "enig/uenig" spørgsmål-især hvis de er mindre uddannede eller har færre oplysninger. En måde at komme uden om denne bias på er at bede deltagerne om at vælge mellem to udsagn ( tvangsvalgformatet ) i stedet for at de er enige eller uenige i en erklæring. De to udsagn ville give to forskellige synspunkter på et emne.
Og udover at være behagelig, respondenterne i undersøgelsen ønsker også at blive set som sympatiske. "Forskning har vist, at respondenterne undervurderer alkohol- og stofbrug, skatteunddragelse og racemæssig skævhed; de kan også overvurdere kirkedeltagelse, velgørende bidrag og sandsynligheden for, at de vil stemme ved et valg, "bemærker Pew Research. Derfor, spørgsmålene skal indrammes på en måde, der giver deltagerne et "out" for at indrømme mindre end ønskelig adfærd. Så, et spørgsmål om afstemning kan formuleres som:"I præsidentvalget i 2012 mellem Barack Obama og Mitt Romney, opstod der ting, der forhindrede dig i at stemme, eller stemte du tilfældigt? "
En almindelig type bias stammer fra en ubehagelig virkelighed i den videnskabelige kultur. Forskere har et konstant behov for at offentliggøre artikler i tidsskrifter, for at opretholde deres omdømme og stige i den akademiske verden. At publicerings-eller-forgæves mentalitet kan have indflydelse på resultaterne af hypoteser, fordi som en kritiker bemærker, akademia har en tendens til at bias mod statistisk signifikant, "positive" resultater [kilde:van Hilten].
Ja, metaanalyser viser, at tidsskrifter er meget mere tilbøjelige til at offentliggøre undersøgelser, der rapporterer et statistisk signifikant positivt resultat end dem, der ikke gør det. Publikationsbias er stærkere på nogle områder end andre; en undersøgelse fra 2010 viste, at papirer inden for samfundsvidenskaberne har 2,3 gange større sandsynlighed for at vise positive resultater end artikler inden for de fysiske videnskaber [kilde:Fanelli].
Som Ian Roberts, professor i epidemiologi og folkesundhed ved London School of Hygiene and Tropical Medicine, bemærket i et essay fra 2015, kliniske forsøg, der viser, at en behandling virker, er meget mere tilbøjelige til at blive offentliggjort end dem, der viser, at den ikke har nogen fordel eller endda skadelig.
På nogle måder, dette er bagsiden af publikationsbias. Negative resultater fra en undersøgelse bliver skubbet ind i en metaforisk filskuffe i stedet for at blive offentliggjort. Kritikere ser det som et særligt problem, når det kommer til undersøgelser af nye lægemidler, som i disse dage ofte er sponsoreret af de virksomheder, der udviklede dem [kilde:Pannucci og Wilkins].
Fil-skuffe bias kan være betydningsfuld. En undersøgelse, der blev offentliggjort i New England Journal of Medicine i 2008, sammenlignede resultaterne af offentliggjorte undersøgelser af antidepressiva med data fra et amerikansk Food and Drug Administration -forskningsregister, der omfattede upublicerede oplysninger. Det fandt ud af, at 94 procent af de offentliggjorte undersøgelser rapporterede, at lægemidler havde positive effekter. Men da de upublicerede undersøgelser blev inkluderet, antallet med positive resultater faldt til 51 procent [kilde:Turner, et al.].
I et forsøg på at få mere information til det offentlige område, Kongressen vedtog i 2007 en lov, der krævede, at forskere rapporterede resultaterne af mange menneskelige undersøgelser af eksperimentelle behandlinger til ClinicalTrials.gov. I 2016, den amerikanske fødevare- og lægemiddeladministration styrket reglerne, kræver mere grundig rapportering af kliniske forsøg herunder medicin og udstyr, der blev undersøgt, men aldrig blev bragt på markedet [kilde:Piller].
Men nogle kritikere bekymrer sig for, at lovene ikke vil have mange tænder, da der ikke er en stigning i håndhævelsesbemandingen.
Denne opgave var interessant for mig, siden jeg gennem årene ofte har været nødt til at skrive artikler baseret på videnskabelig forskning. Journalister, Jeg tror, nødt til at undgå fristelsen til at antage, at den seneste publicerede undersøgelse skal være det endelige ord om ethvert emne.
Sidste artikelUndskyld,
Næste artikelKræftforskere sniffer ud af generne bag Durians Famous Stink