Et nyt papir ledet af Knowledge Lab giver et andet mål for influencers i stipendium. Kredit:University of Chicago
I århundreder, forskere og forskere har målt indflydelse fra enkeltpersoner og opdagelser gennem citater, en rå statistik underlagt skævheder, politik og andre skævvridninger. Et nyt papir ledet af Knowledge Lab ved University of Chicago beskriver en anderledes måde at holde score i videnskab på - et mere direkte mål for, hvordan indflydelsesrige ideer bølger ud på tværs af stipendium og kultur.
Beregningsmodellen kaster rampelyset på arbejde, der ændrede videnskabens vej, men er forblevet undervurderet. Den samme tilgang kan også tilpasses til at spore indflydelse på andre områder, hvor der ikke eksisterer nogen citationskultur, såsom litteratur eller musik, sagde forfatterne til avisen, der blev offentliggjort i sidste uge Proceedings of the National Academy of Sciences .
"Vi måler, hvor meget videnskabsmænds og forskeres skrifter påvirker diskussionen om ideer i fremtiden, " sagde James Evans, direktør for Knowledge Lab og professor i sociologi ved UChicago. "Indflydelse er en politiseret proces; dem, der får indflydelse, få æren, og de, der får æren, får kapitalen til at gøre det næste store. Det er første gang, vi har en skærpet evne til at identificere indflydelse, og også at diagnosticere sociale og strategiske påvirkninger på citerende adfærd."
Det nye papir supplerer tidligere Knowledge Lab-forskning ved hjælp af beregnings- og maskinlæringsmetoder på massive tekstsamlinger, bevillinger, anmeldelser, citater og videnskabelige data for at studere, hvordan opdagelser dannes, udvikle sig og blive bredt accepteret. Deres arbejde blev for nylig omtalt i en anmeldelse i tidsskriftet Videnskab , medforfatter af Evans, der beskrev, hvordan datadrevne metoder har uddybet forståelsen af den videnskabelige proces og givet ny indsigt i, hvordan man mere effektivt kan gøre fremtidige vigtige opdagelser.
Går ud over citater
I teorien, referencer i et akademisk papir gør det muligt for forfattere at kreditere deres forgængere, forskerne og det arbejde, som de byggede deres nye opdagelse på. Men i praksis, citater er valgt af mange grunde - forfattere er mere tilbøjelige til at citere sig selv, magtfulde kolleger inden for deres felt og forskere ved prestigefyldte institutioner, og er ofte forudindtaget i forhold til at citere nyere eller allerede højt citerede artikler.
På trods af disse ufuldkommenheder, mange beregningsmæssige undersøgelser af videnskabelig indflydelse har brugt citationsposten som en nyttig proxy. Den nye undersøgelse, ledet af tidligere Knowledge Lab postdoc-forsker Aaron Gerow, demonstrerer en roman, dybere tilgang, ved at bruge både den fulde tekst af artikler og ekstern information såsom forfatterens identitet, tilknytning og journalomdømme.
Ved at bruge en beregningsmetode kendt som emnemodellering - opfundet af medforfatter David Blei fra Columbia University - sporer modellen "diskursiv indflydelse, "eller tilbagevendende ord og vendinger gennem historiske tekster, der måler, hvordan forskere faktisk taler om et felt, i stedet for blot deres tilskrivninger. For at bestemme en given papirs indflydelse, forskerne kunne statistisk fjerne det fra historien og se, hvordan videnskabelig diskurs ville have udspillet sig uden dets bidrag.
"Vi kan ikke kun finde ud af, hvordan emner ændrede sig over tid, men vi kan faktisk simulere fremtiden uden et givet dokument fra fortiden, og se på, hvordan fremadgående diskurs var forskellig med og uden et givet dokument, " sagde Gerow, nu adjunkt ved Goldsmiths, University of London. "Citater er en slags påvirkning, og diskursiv indflydelse er en anden slags. Ingen af dem er hele historien, men de arbejder sammen for at give et bedre billede af, hvad der påvirker videnskaben."
Træning af modellen på massive tekstsamlinger fra datalingvistik, fysik, og på tværs af videnskab og stipendier (JSTOR), forfatterne kvantificerer forskellige skævheder og skelner forskellige mønstre for indflydelse. Videnskabsmænd, der vedholdende publicerede på et enkelt felt, var mere tilbøjelige til at blive "kanoniseret" på en måde, der tvang andre til at citere dem ude af proportioner med deres artiklers diskursive bidrag. På den anden side, opdagelser, der krydsede disciplinære grænser, var mere tilbøjelige til at have større diskursiv effekt, men færre citater, sandsynligvis fordi "ejeren" af ideen og hendes allierede forbliver socialt og institutionelt fjernt fra den citerende forfatter.
Sovende skønheder og ukendte influencers
En interessant underkategori af papir, som modellen opdagede, er kendt som "sovende skønheder, " eller papirer, der var relativt uanerkendte i årevis eller endda årtier, før de oplevede et sent udbrud af citater. F.eks. et papir fra 1947 om grafen forblev uklart og glemt indtil 1990'erne med en genopblussen af forskningsinteresse for materialet og en eventuel Nobelpris.
"Aviser har en nyhedscyklus, når mange mennesker chatter om dem og citerer dem, og så er de ikke længere nye nyheder, " sagde Evans. "Vores model viser, at nogle artikler har meget mere indflydelse, end citater typisk vil vise, såsom disse 'sovende skønheder, ' som ikke havde meget indflydelse tidligt, men som senere bliver værdsat og vigtig."
Samme model kan også bruges til at spore indflydelse på andre områder, såsom litteratur og musik, sagde forfatterne. Tekst fra digte eller sangtekster, og endda ekstratekstuelle karakteristika såsom strofestruktur eller akkordforløb, kunne fodre ind i modellen for at finde under-anerkendte påvirkere og kortlægge spredningen af nye koncepter og innovationer.
"Der er en enorm mængde litterær kultur, som ender med at påvirke alle mulige ting, men som simpelthen ikke har en referenceteknologi, der ligner citater, "Evans sagde." Selvom vi udviklede og validerede på denne model om videnskabelig tekst, nu kan vi bruge det til alt og alt, især tilfælde, hvor der ikke er spor af indflydelse men mønstre i selve indholdet. Det er som at trende på Twitter, men hvor alt er Twitter. Det er det, der er mest spændende for mig."