Videnskab
 science >> Videnskab >  >> Elektronik

Maskinlæringsværktøj Quicksilver kan finde oversete hunner

Wikipedia logo.

Primers John Bohannon har opdaget folks arbejde og bidrag takket være et maskinlæringssystem bygget hos Primer. "Det gør så meget, som et menneske ville, hvis et menneske kunne læse 500 millioner nyhedsartikler, 39 millioner videnskabelige artikler, hele Wikipedia, og så skriv 70, 000 biografiske resuméer af forskere. "Grunden til at dette er nyheder er, fordi du sandsynligvis aldrig ville vide om deres bidrag ved at besøge Wikipedia, men han kender en måde at løse det på.

Wikipedia ser ud til at have et kønsproblem, For en. Det er et spørgsmål om underrepræsentation. Og nu har maskinlæringssystemet hos en AI-startup vist, hvordan det kunne løse situationen.

Primer er i nyhederne. Primer-systemet blev trænet i videnskabelige tidsskrifter. Værktøjet til udfyldning af kønsgab hedder Quicksilver. Den kan få øje på mange oversete kvindelige videnskabsmænd uden tilstedeværelse på Wikipedia. Cory Doctorow ind Boing Boing sagde, at 18 % af Wikipedias biografiske indlæg handlede om kvinder, og at langt størstedelen af ​​Wikipedianere var mænd.

Show-all-processen involverede 30, 000 Wikipedia-indlæg for at skabe en model, der gjorde det muligt for den at identificere karakteristika, der gør en videnskabsmand bemærkelsesværdig for encyklopædisk inklusion. Derefter, det minede den akademiske søgemaskine Semantic Scholar for at identificere 200, 000 forfattere af videnskabelige artikler.

Sagde Tom Simonite Kablet :"Kun 18 procent af dets biografier er af kvinder. Undersøgelser anslår, at mellem 84 og 90 procent af Wikipedia-redaktørerne er mænd."

Rent faktisk, hvis du fanger historien Kablet , kønsfixet er en del af den større historie om Quicksilver, der leder efter grimme huller.

I det større billede, bloggede Bohannon, "Vores mål er at hjælpe det åbne dataforskningsfællesskab med at bygge bedre værktøjer til at vedligeholde Wikipedia og Wikidata, startende med videnskabeligt indhold.

(Ud over, "Quicksilver ser ikke bare overset enkeltpersoner og genererer udkast til artikler. Det kan også bruges til at vedligeholde Wikipedia -poster og identificere, hvornår de ikke er blevet opdateret i et stykke tid, " sagde James Vincent ind Randen .)

Så, hvad er løsningen? Bemærk, at Primer ikke handler om automatiserede fixer-overdele. Sagde Simonite, "det planlægger aldrig at lade Quicksilver autonomt tilføje webstedet." Kablet citerede administrerende direktør for Primer, Sean Gourley. "Der er altid mennesker i løkken." Populær Videnskab sagde, "Quicksilver opdager videnskabsmænd, der burde have Wikipedia-artikler om dem og skriver et første udkast."

Deres arbejde fortsætter. Bohannon sagde, at de stille og roligt har testet og forbedret Quicksilver i flere måneder. "Selv før vi var færdige med tekstgenereringskomponenten, Quicksilver blev brugt i tre engelske Wikipedia-redigeringer til at forbedre dækningen af ​​videnskabskvinder. (Tak til 500 kvindelige videnskabsmænd for at samarbejde og inspirere os!)" Han sagde, at de vil beskrive deres arkitektur i detaljer i fremtidige indlæg.

I mellemtiden skrev Simonite, "Wikipedias notorisk punktlige fællesskab vil sandsynligvis holde et vågent øje med indhold, der er genereret med Quicksilvers hjælp. Et spørgsmål er, om dette værktøj, der har til formål at rette blinde vinkler, har sine egne blinde vinkler."

© 2018 Tech Xplore