Udvinding af enorme datasæt af engelsk afslører stereotyper om køn, race og klasse, der er fremherskende i engelsktalende samfund. Tessa Charlesworth og kolleger udviklede en trinvis procedure, Flexible Intersectional Stereotype Extraction (FISE), som de anvendte på milliarder af ord med engelsk internettekst.
Denne procedure gjorde det muligt for dem at udforske træk forbundet med intersektionelle identiteter ved at kvantificere, hvor ofte besættelsesetiketter eller egenskabsadjektiver blev indsat i nærheden af sætninger, der refererede til flere identiteter, såsom "sorte kvinder", "rige mænd", "fattige kvinder" eller " Hvide mænd."
I deres analyse, offentliggjort i PNAS Nexus , viser forfatterne først, at metoden er en valid måde at uddrage stereotyper på:erhverv, der i virkeligheden var domineret af bestemte identiteter (f.eks. er arkitekt, ingeniør, leder domineret af hvide mænd) er også i sproget stærkt forbundet med den samme intersektionelle gruppe med en hastighed, der er væsentligt over chancen - omkring 70 %.
Dernæst så forfatterne på personlighedstræk. FISE-proceduren viste, at 59 % af de undersøgte egenskaber var forbundet med "hvide mænd", men kun 5% af karakteristikaene var forbundet med "sorte kvinder".
Ifølge forfatterne indikerer ubalancerne i trækfrekvenser en gennemgribende androcentrisk (mandscentreret) og etnocentrisk (hvidcentreret) bias på engelsk. Valensen (positivitet/negativitet) af de tilknyttede egenskaber var også ubalanceret. Omkring 78 % af karakteristika forbundet med "White Rich" var positive, mens kun 21% af karakteristika forbundet med "Black Poor" var positive.
Mønstre som disse har downstream-konsekvenser i AI, computeroversættelse og tekstgenerering, ifølge forfatterne. Ud over at forstå, hvordan intersektionel bias former sådanne resultater, bemærker forfatterne, at FISE kan bruges til at forske i en række intersektionelle identiteter på tværs af sprog og endda på tværs af historien.
Flere oplysninger: Tessa E S Charlesworth et al., Udtrækning af intersektionelle stereotyper fra indlejringer:Udvikling og validering af den fleksible intersektionelle stereotypeekstraktionsprocedure, PNAS Nexus (2024). DOI:10.1093/pnasnexus/pgae089
Leveret af PNAS Nexus
Sidste artikelForskning afslører, hvad universitetsstuderende mener, når de siger, at de bare taler
Næste artikelHvis TikTok er forbudt i USA eller Australien, hvordan kan virksomheden så reagere?