Det kan tage tid for et lille skridt fremad at vise sit værd. Kredit:ellissharp/Shutterstock.com
I en nylig undersøgelse af over 1, 500 videnskabsmænd, mere end 70 procent af dem rapporterede at have været ude af stand til at gengive andre forskeres resultater mindst én gang. Omkring halvdelen af de adspurgte videnskabsmænd løb ind i problemer med at prøve at gengive deres egne resultater. Ikke underligt, at folk taler om en "reproducerbarhedskrise" i videnskabelig forskning - en epidemi af undersøgelser, der ikke holder stand, når de køres for anden gang.
Reproducerbarhed af resultater er et kernefundament for videnskab. Hvis videnskabelige resultater kun gælder i nogle laboratorier, men ikke i andre, hvordan kan forskere så føle sig sikre på deres opdagelser? Hvordan kan samfundet indføre evidensbaserede politikker, hvis beviserne er upålidelige?
Anerkendelsen af denne "krise" har foranlediget opfordringer til reformer. Forskere mærker efter, eksperimentere med forskellige praksisser beregnet til at hjælpe med at skelne solid videnskab fra irreproducerbare resultater. Nogle mennesker begynder endda at revurdere, hvordan der træffes valg om, hvilken forskning der rent faktisk bliver grebet an. At bryde innovativt nyt er mere prangende end at gense allerede offentliggjort forskning. Fører prioritering af nyheder naturligt til dette punkt?
Incitament til det forkerte?
En løsning på reproducerbarhedskrisen kunne være simpelthen at udføre en masse replikationsundersøgelser. For eksempel, det videnskabelige tidsskrift eLife deltager i et initiativ til at validere og reproducere vigtige nyere resultater inden for kræftforskning. Det første sæt af disse "gentagelses" undersøgelser blev for nylig udgivet og gav blandede resultater. Resultaterne af 2 ud af 5 forskningsundersøgelser var reproducerbare, en var ikke, og to yderligere undersøgelser gav ikke endelige svar.
Der er ingen grund til at begrænse denne form for gentagelsesundersøgelser til kræftforskning – reproducerbarhedsproblemer kan ses på tværs af forskellige områder af videnskabelig forskning.
Men der er mindst én stor hindring for at investere tid og kræfter i denne bestræbelse:søgen efter nyhed. Et akademisk tidsskrifts prestige afhænger i det mindste delvist af, hvor ofte de forskningsartikler, det udgiver, citeres. Dermed, forskningstidsskrifter ønsker ofte at offentliggøre nye videnskabelige resultater, som er mere tilbøjelige til at blive citeret, ikke nødvendigvis resultaterne af nyudført ældre forskning.
En undersøgelse af kliniske forsøg offentliggjort i medicinske tidsskrifter viste, at de mest prestigefyldte tidsskrifter foretrækker at publicere undersøgelser, der anses for at være meget nye og ikke nødvendigvis dem, der har de mest solide tal, der understøtter påstandene. Finansieringsbureauer såsom National Institutes of Health beder videnskabsmænd, der gennemgår ansøgninger om forskningsbevillinger, om at give en "innovationsscore" for at prioritere finansiering til det mest innovative arbejde. Og videnskabsmænd bemærker selvfølgelig disse tendenser – en undersøgelse fandt brugen af positive ord som "roman, " "fantastiske, " "nyskabende" og "uden fortilfælde" i papirabstrakter og titler blev næsten nidoblet mellem 1974 og 2014.
Genetikforsker Barak Cohen ved Washington University i St. Louis offentliggjorde for nylig en kommentar, der analyserer dette voksende skub efter nyheder. Han foreslår, at fremskridt inden for videnskab afhænger af en delikat balance mellem nyhed og kontrol af andre videnskabsmænds arbejde. Når belønninger såsom finansiering af tilskud eller publicering i prestigefyldte tidsskrifter understreger nyhed på bekostning af test af tidligere offentliggjorte resultater, videnskaben risikerer at udvikle revner i sit fundament.
Huse af mursten, palæer af halm
Kræftforsker William Kaelin Jr., en modtager af 2016 Albert Lasker Award for Basic Medical Research, for nylig argumenteret for færre "palæer af halm" og flere "huse af mursten" i videnskabelige publikationer.
En af hans største bekymringer er, at videnskabelige artikler nu puster deres påstande op for at understrege deres nyhed og relevansen af biomedicinsk forskning til kliniske anvendelser. Ved at udveksle dybdegående forskning med bredden af påstande, forskere kan risikere at kompromittere arbejdets robusthed. Ved at hævde overdreven nyhed og virkning, forskere kan underminere dens faktiske betydning, fordi de muligvis ikke kan levere solide beviser for hver enkelt påstand.
Kaelin foreslår endda, at noget af hans eget arbejde fra 1990'erne, som transformerede cellebiologiske forskning ved at opdage, hvordan celler kan mærke ilt, kan have kæmpet for at blive offentliggjort i dag.
Prestigefyldte tidsskrifter efterspørger nu ofte komplette videnskabelige historier, fra grundlæggende molekylære mekanismer til at bevise deres relevans i forskellige dyremodeller. Uforklarede resultater eller ubesvarede spørgsmål ses som svagheder. I stedet for at udgive et spændende romanfund, der er robust, og som kunne afføde en ny retning for forskning udført af andre grupper, forskere bruger nu år på at samle en hel række af resultater med brede påstande om nyhed og virkning.
Afbalancering af friske fund og robusthed
En udfordring for redaktører og anmeldere af videnskabelige manuskripter er at vurdere nyheden og den sandsynlige langsigtede virkning af det arbejde, de vurderer. Den endelige betydning af en ny, en unik videnskabelig idé er nogle gange svær at genkende selv af jævnaldrende, der er funderet i eksisterende viden. Mange grundforskningsstudier danner grundlag for fremtidige praktiske anvendelser. En nylig undersøgelse viste, at af grundforskningsartikler, der modtog mindst ét citat, 80 procent blev til sidst citeret af en patentansøgning. Men det tager tid, før den praktiske betydning kommer frem.
Et samarbejdende hold af økonomiske forskere har for nylig udviklet et usædvanligt mål for videnskabelig nyhed ved omhyggeligt at studere referencerne i et papir. De rangerede en videnskabelig artikel som mere ny, hvis den citerede en forskelligartet kombination af tidsskrifter. For eksempel, en videnskabelig artikel, der citerer et botaniktidsskrift, et økonomisk tidsskrift og et fysiktidsskrift ville blive betragtet som meget nyt, hvis ingen anden artikel havde citeret denne kombination af forskellige referencer før.
Denne målestok for nyhed gjorde det muligt for dem at identificere papirer, der var mere tilbøjelige til at blive citeret i det lange løb. Men det tog omkring fire år, før disse nye artikler begyndte at vise deres større gennemslagskraft. Man kan være uenig i denne særlige indikator for nyhed, men undersøgelsen gør en vigtig pointe:Det tager tid at erkende den fulde effekt af nye resultater.
At indse, hvor svært det er at vurdere nyheder, bør give finansieringsbureauer, tidsskriftsredaktører og videnskabsmænd holder pause. Fremskridt inden for videnskab afhænger af nye opdagelser og at følge uudforskede veje - men solide, reproducerbar forskning kræver lige stor vægt på arbejdets robusthed. Ved at genoprette balancen mellem krav og belønninger for nyhed og robusthed, videnskaben vil opnå endnu større fremskridt.
Denne artikel blev oprindeligt publiceret på The Conversation. Læs den originale artikel.
Sidste artikelForskning afslører chokerende svaghed ved laboratoriekurser
Næste artikelForskere viser højtydende vejrtrækning i knogler