Videnskab
 science >> Videnskab >  >> Elektronik

Kvinder er smukke, mænd rationelle

Kredit:Københavns Universitet

Mænd beskrives typisk med ord, der henviser til adfærd, mens adjektiver tilskrevet kvinder har en tendens til at være forbundet med fysisk udseende. Det her, ifølge en gruppe dataloger fra Københavns Universitet og andre universiteter, der indsatte maskinlæring til at analysere 3,5 millioner bøger.

"Smuk" og "sexet" er to af de adjektiver, der oftest bruges til at beskrive kvinder. Almindeligt anvendte deskriptorer til mænd omfatter 'retfærdige, "'rationel' og 'modig'.

En datalog fra Københavns Universitet, sammen med andre forskere fra USA, trawled gennem en enorm mængde bøger i et forsøg på at finde ud af, om der er forskel mellem de ordtyper, der bruges til at beskrive mænd og kvinder i litteraturen. Ved hjælp af en ny computermodel, forskerne analyserede et datasæt på 3,5 millioner bøger, alle udgivet på engelsk mellem 1900 og 2008. Bøgerne indeholder en blanding af fiktion og faglitteratur.

"Vi er klart i stand til at se, at de ord, der bruges til kvinder, refererer meget mere til deres udseende end de ord, der bruges til at beskrive mænd. Således, vi har kunnet bekræfte en udbredt opfattelse, først nu på et statistisk niveau, "siger datalog og adjunkt Isabelle Augenstein fra Københavns Universitets Institut for Datalogi.

Forskerne udtrak adjektiver og verber forbundet med kønsspecifikke substantiver (f.eks. 'Datter' og 'stewardesse'). For eksempel, i kombinationer som 'sexet stewardesse' eller 'piger, der sladrer.' De analyserede derefter, om ordene havde en positiv, negativ eller neutral følelse, og efterfølgende hvilke kategorier ordene kunne deles i.

Deres analyser viser, at negative verber forbundet med krop og udseende bruges med fem gange hyppigheden for kvinder end mænd. Analyserne viser også, at positive og neutrale adjektiver vedrørende krop og udseende forekommer cirka dobbelt så ofte i beskrivelser af hunner, mens mænd oftest beskrives ved hjælp af adjektiver, der henviser til deres adfærd og personlige egenskaber.

I fortiden, lingvister kiggede typisk på forekomsten af ​​kønssprog og bias, men ved hjælp af mindre datasæt. Nu, edb -forskere er i stand til at implementere maskinlæringsalgoritmer til at analysere store datamængder - i dette tilfælde 11 milliarder ord.

Nyt liv for gamle kønsstereotyper

Selvom mange af bøgerne blev udgivet for flere årtier siden, de spiller stadig en aktiv rolle, påpeger Isabelle Augenstein. De algoritmer, der bruges til at oprette maskiner og applikationer, der kan forstå menneskeligt sprog, fodres med data i form af tekstmateriale, der er tilgængeligt online. Dette er den teknologi, der gør det muligt for smartphones at genkende vores stemmer og gør det muligt for Google at levere forslag til søgeord.

"Algoritmerne arbejder på at identificere mønstre, og hver gang man observeres, det opfattes, at noget er 'sandt.' Hvis nogen af ​​disse mønstre refererer til partisk sprog, resultatet vil også være forudindtaget. Systemerne vedtager, så at sige, det sprog, vi mennesker bruger, og dermed, vores kønsstereotyper og fordomme, "siger Isabelle Augenstein, og giver et eksempel på, hvor det kan være vigtigt:

"Hvis det sprog, vi bruger til at beskrive mænd og kvinder, er forskelligt, i medarbejderanbefalinger f.eks. Det vil påvirke, hvem der tilbydes et job, når virksomheder bruger it -systemer til at sortere jobansøgninger. "

Efterhånden som kunstig intelligens og sprogteknologi bliver mere fremtrædende på tværs af samfundet, det er vigtigt at være opmærksom på kønssprog.

Augenstein fortsætter:"Vi kan forsøge at tage dette i betragtning, når vi udvikler maskinlæringsmodeller ved enten at bruge mindre forudindtaget tekst eller ved at tvinge modeller til at ignorere eller modvirke bias. Alle tre ting er mulige."

Forskerne påpeger, at analysen har sine begrænsninger, ved, at det ikke tager højde for, hvem der skrev de enkelte passager og forskellene i bias -grader afhængigt af, om bøgerne blev udgivet i en tidligere eller senere periode inden for datasættets tidslinje. Desuden, det skelner ikke mellem genrer - f.eks. mellem romantiske romaner og faglitteratur. Forskerne følger i øjeblikket op på flere af disse emner.


Varme artikler