Alessia Iancarelli, en doktorand i Northeasterns Affective and Brain Sciences laboratorium. Kredit:Alyssa Stone/Northeastern University
Hvis du vil være videnskabsmand, bliver du nødt til at læse meget.
Videnskab er en indsats fokuseret på at opbygge og dele viden. Forskere udgiver artikler, der beskriver deres opdagelser, gennembrud og innovationer for at dele disse afsløringer med kolleger. Og der er millioner af videnskabelige artikler hvert år.
At følge med i den seneste udvikling inden for deres felt er en udfordring for forskere på alle punkter af deres karriere, men det påvirker især forskere i den tidlige karriere, da de også skal læse de mange artikler, der repræsenterer grundlaget for deres felt.
"Det er umuligt at læse alt. Absolut umuligt," Ajay Satpute, direktør for Affective and Brain Science Lab og assisterende professor i psykologi ved Northeastern. "Og hvis du ikke ved alt, hvad der er sket i marken, er der en reel chance for at genopfinde hjulet igen og igen og igen." Udfordringen, siger han, er at finde ud af, hvordan man kan træne den næste generation af forskere økonomisk, og balancere behovet for at læse alle de afgørende artikler med at uddanne dem som forskere i deres egen ret.
Den opgave bliver kun sværere, siger Alessia Iancarelli, en ph.d.-studerende, der studerer affekt- og socialpsykologi i Satputes laboratorium. "Mængden af udgivet litteratur bliver bare ved med at stige," siger hun. "Hvordan er videnskabsmænd i stand til at udvikle deres stipendium inden for et felt givet denne enorme mængde litteratur?" De skal vælge og vrage, hvad de vil læse.
Men fælles tilgange til den prioritering, siger Iancarelli, kan inkorporere skævheder og udelade afgørende hjørner af feltet. Så Iancarelli, Satpute og kolleger udviklede en maskinlæringstilgang for at finde en bedre – og mindre forudindtaget – måde at lave en læseliste på. Deres resultater, som blev offentliggjort i sidste uge i tidsskriftet PLOS One , hjælper også med at reducere kønsbias.
"Der er virkelig et problem med, hvordan vi udvikler stipendium," siger Satpute. Lige nu vil videnskabsmænd ofte bruge et søgeværktøj som Google Scholar om et emne og starte derfra, siger han. "Eller, hvis du er heldig, får du en vidunderlig instruktør og har et godt pensum. Men det bliver dybest set feltet gennem den persons øjne. Så jeg tror, at det her virkelig udfylder en niche, der kan være med til at skabe balance og tværfagligt stipendium uden nødvendigvis at have adgang til en vidunderlig instruktør, for det er ikke alle, der får det."
Problemet med noget som Google Scholar, forklarer Iancarelli, er, at det vil give dig de mest populære artikler inden for et felt, målt på hvor mange andre artikler, der har citeret dem. Hvis der er undergrupper af dette felt, der ikke er så populære, men som stadig er relevante, kan de vigtige artikler om disse emner blive savnet med en sådan søgning.
Tag for eksempel emnet aggression (som er det emne, forskerne fokuserede på for at udvikle deres algoritme). Medier og videospil er et særligt varmt emne inden for aggressionsforskning, siger Iancarelli, og derfor er der meget flere artikler om den delmængde af feltet end om andre emner, såsom testosterons rolle og social aggression.
Så Iancarelli besluttede at gruppere artikler om emnet aggression i fællesskaber. Ved hjælp af citationsnetværksanalyse identificerede hun 15 forskningsmiljøer om aggression. I stedet for at se på det rå antal gange, en artikel er blevet citeret i en anden forskningsartikel, bestemmer algoritmen et fællesskab af artikler, der har tendens til at citere hinanden eller det samme kernesæt af artikler. De største samfund, den afslørede, var medier og videospil, stress, træk og aggression, drøvtygning og fordrevet aggression, testosterons rolle og social aggression. Men der var også nogle overraskelser, såsom et mindre fællesskab af forskningsartikler med fokus på aggression og heste.
"Hvis du bruger fællesskabsdetektion, så får du dette virkelig rige, granulære blik på aggressionsfeltet," siger Satpute. "Du har et slags fugleperspektiv af hele feltet i stedet for at [det ser ud til at] aggressionsfeltet dybest set er medier, videospil og vold."
Ud over at diversificere emnerne ved at bruge denne fællesskabstilgang, fandt forskerne også, at procentdelen af artikler med kvindelige førsteforfattere, der blev døbt indflydelsesrige af algoritmen, fordobledes i forhold til, når de kun fokuserede på det samlede antal citater. (Iancarelli tilføjer, at der kan være nogle skævheder indbygget i dette resultat, da holdet ikke kunne spørge forfatterne direkte om deres kønsidentitet og i stedet måtte stole på antagelser baseret på forfatterens navn, billede og eventuelle pronominer, der blev brugt til at henvise til dem .)
Holdet har frigivet koden bag denne algoritme, så andre kan bruge den og replikere deres tilgang til citationsnetværksanalyse i andre forskningsområder.
For Iancarelli er der en anden motivation:"Jeg ville elske at bruge dette arbejde til at skabe en pensum og undervise i mit eget kursus om menneskelig aggression. Jeg ville virkelig elske at basere pensum på de mest relevante papirer fra hvert enkelt samfund for at give en ægte general syn på det menneskelige aggressionsfelt."