Videnskab
 science >> Videnskab >  >> Andet

Excel autokorrigerer videnskabelig forskning. Og det er ikke fedt

Excel autokorrigerer videnskabelig forskning. Og det er ikke fedt HowStuffWorks NU

Chancerne er gode for, at du enten har sendt eller modtaget en besked, der er forkert takket være autokorrektur eller autofuldførelse. Der er hundredvis af memes, hvor disse fejl forårsager fejlkommunikation, ofte med sjove resultater. Som denne. Eller denne. Eller denne.

Men det er ikke så sjovt, når det sker med dit videnskabelige papir. Akademiske artikler indeholder ofte supplerende filer med data, diagrammer og grafer, der understøtter papirets konklusion. Mange af disse filer er regneark.

Siden 2004 har forskere har bemærket, at Microsoft Excel, det populære regnearksprogram, har en dårlig vane med at ændre nogle gennavne til andre typer data. For eksempel, genetikere bruger MARCH1 som stenografi for membranassocieret ring-CH-type finger 1. Men Excel fortolker MARCH1 som en dato, automatisk konvertere den til 1-mar eller en anden betegnelse for den første marts.

Excel fejlagtigt identificerer nogle andre gennavne som koordinater eller flydende punkter. Du kan muligvis finde ud af, at 1. marts faktisk er 1. marts, men hvad med 2.31E+13? Sådan konverterer Excel RIKEN -id 2310009E13. RIKEN er et massivt forskningsinstitut i Japan, der, blandt andet, gennemfører genomprojekter. (For ordens skyld, vi forsøgte at tilslutte RIKEN -id'et til et Excel -regneark og fik det automatisk konverteret til 2.31E+19, stadig forkert og stadig ikke hvad der er tænkt i de akademiske artikler.)

På trods af at forskere første gang identificerede dette problem for mere end et årti siden, det vedvarer i dag. Forskere Mark Ziemann, Yotam Eren og Assam El-Osta screenede mere end 35, 000 supplerende filer for at se, hvor udbredt problemet faktisk var. De udviklede automatiseret software, der søgte efter data, der lignede, at det kunne være en liste over gennavne. De identificerede 7, 467 genlister, der repræsenterer de supplerende data for 3, 597 publicerede artikler i 18 forskellige tidsskrifter. Det viste sig, at 704 af de offentliggjorte artikler indeholdt filer med Excel -formateringsfejl i dem. Det er en fiasko på 19,6 procent. Med andre ord, næsten hver femte offentliggjorte artikel indeholder supplerende filer med Excel -formateringsfejl i dem.

Dette er ikke bare en ulempe. Forskere stoler på offentliggjorte værker til at guide deres egne projekter. Hvis filerne indeholder fejl, Det kan være svært og tidskrævende at løse problemet og finde de relevante data.

Hvorfor ikke bare slå funktionerne til automatisk formatering fra? Ifølge forskerholdet, der er ingen måde at permanent deaktivere funktionerne i Excel. Du kan muligvis manuelt ændre hver mulighed hver gang du opretter en ny fil, men det er ineffektivt. De påpegede, imidlertid, at Google Sheets ikke følger den samme tilgang til formatering. Hvad mere er, hvis du først lægger alle dine data i Google Sheets og derefter kopierer dem til et andet regnearkprogram, formateringen forbliver uberørt.

Det er lidt komisk, at en funktion, der skal hjælpe folk med at bruge regneark, forårsager sådan en hovedpine i akademiske kredse. Måske vil fremtidige versioner af Excel indeholde en mulighed for at deaktivere autoformateringsfunktioner på ubestemt tid. Indtil da, genetikere bør dobbelttjekke deres arbejde eller overveje at skifte til Google Sheets.