Kredit:Diana Levine og MIT Press
Antag, at du gerne vil vide dødeligheden for kvinder under fødslen, efter land, jorden rundt. Hvor ville du kigge? En mulighed er WomanStats Project, webstedet for en akademisk forskningsindsats, der undersøger forbindelserne mellem nationalstaternes sikkerhed og aktiviteter, og sikkerheden for de kvinder, der bor i dem.
Projektet, grundlagt i 2001, opfylder et behov ved at lappe data fra hele verden sammen. Mange lande er ligeglade med at indsamle statistik om kvinders liv. Men selv hvor lande forsøger hårdere at indsamle data, der er klare udfordringer ved at nå frem til brugbare tal – uanset om det kommer til kvinders fysiske sikkerhed, ejendomsrettigheder, og regeringens deltagelse, blandt mange andre spørgsmål.
For eksempel:I nogle lande, krænkelser af kvinders rettigheder kan blive rapporteret mere regelmæssigt end andre steder. Det betyder, at et mere lydhørt retssystem kan skabe udseendet af større problemer, når det giver relativt mere støtte til kvinder. WomanStats-projektet bemærker mange sådanne komplikationer.
Derfor tilbyder WomanStats Project nogle svar – f.eks. Australien, Canada, og store dele af Vesteuropa har lav fødselsdødelighed – samtidig med at det viser, hvad udfordringerne er ved at tage tallene for pålydende. Det her, ifølge MIT-professor Catherine D'Ignazio, gør siden usædvanlig, og værdifulde.
"Dataene taler aldrig for sig selv, " siger D'Ignazio, med henvisning til det generelle problem med at finde pålidelige tal om kvinders liv. "Der er altid mennesker og institutioner, der taler for dataene, og forskellige mennesker har deres egne dagsordener. Dataene er aldrig uskyldige."
Nu D'Ignazio, en adjunkt i MIT's afdeling for bystudier og planlægning, har kigget dybere på dette problem i en ny bog, medforfatter med Lauren Klein, en lektor i engelsk og kvantitativ teori og metoder ved Emory University. I bogen, "Datafeminisme, "udgivet denne måned af MIT Press, forfatterne bruger den intersektionelle feminismes linse til at granske, hvordan datavidenskab afspejler de sociale strukturer, den opstår fra.
"Intersektionel feminisme undersøger ulige magt, "skriver D'Ignazio og Klein, i bogens indledning. "Og i vores nutidige verden, data er også magt. Fordi datakraften bliver brugt uretfærdigt, det skal udfordres og ændres«.
4 procent problemet
For at se et tydeligt tilfælde af magtrelationer, der genererer forudindtaget data, D'Ignazio og Klein bemærker, overveje forskning ledet af MITs egen Joy Buolamwini, der som kandidatstuderende i en klasse studerer ansigtsgenkendelsesprogrammer, observerede, at den pågældende software ikke kunne "se" hendes ansigt. Buolamwini fandt, at for det pågældende ansigtsgenkendelsessystem, softwaren var baseret på et sæt ansigter, som var 78 procent mænd og 84 procent hvide; kun 4 procent var kvinder og mørkhudede, ligesom hende selv.
Efterfølgende mediedækning af Buolamwinis arbejde, D'Ignazio og Klein skriver, indeholdt "en antydning af chok." Men resultaterne var sandsynligvis mindre overraskende for dem, der ikke er hvide mænd, de tror.
"Hvis fortiden er racistisk, undertrykkende, sexistisk, og partisk, og det er dine træningsdata, det er det du tuner efter, " siger D'Ignazio.
Eller overvej et andet eksempel, fra teknologigiganten Amazon, som testede et automatiseret system, der brugte AI til at sortere lovende CV'er indsendt af jobansøgere. Et problem:Fordi en høj procentdel af virksomhedens ansatte var mænd, algoritmen favoriserede mænds navne, alt andet lige.
"De troede, at dette ville hjælpe processen, men det, det gør, er selvfølgelig at træne AI-systemet til at være forudindtaget over for kvinder, fordi de ikke selv har ansat så mange kvinder, " konstaterer D'Ignazio.
Til Amazons kredit, den genkendte problemet. I øvrigt, D'Ignazio bemærker, denne form for problemer er et problem, der kan løses. "Nogle af teknologierne kan reformeres med en mere deltagende proces, eller bedre træningsdata. … Hvis vi er enige, er det et godt mål, en vej frem er at justere dit træningssæt og inkludere flere farvede mennesker, flere kvinder."
"Hvem er på holdet? Hvem havde ideen? Hvem har gavn?"
Stadig, Spørgsmålet om, hvem der deltager i datavidenskab er, som forfatterne skriver, "elefanten i serverrummet." Fra 2011 kun 26 procent af alle studerende, der modtog datalogigrader i USA, var kvinder. Det er ikke kun et lavt tal, men faktisk et fald fra tidligere niveauer:I 1985, 37 procent af datalogi kandidater var kvinder, højeste karakter nogensinde.
Som følge af den manglende mangfoldighed på området, D'Ignazio og Klein tror, mange dataprojekter er radikalt begrænset i deres evne til at se alle facetter af de komplekse sociale situationer, de foregiver at måle.
"Vi vil prøve at tune folk ind på den slags magtforhold, og hvorfor de betyder så meget, " D'Ignazio siger. "Hvem er på holdet? Hvem havde ideen? Hvem får gavn af projektet? Hvem er potentielt skadet af projektet?"
I alt, D'Ignazio og Klein skitserer syv principper for datafeminisme, fra at undersøge og udfordre magt, at gentænke binære systemer og hierarkier, og omfavne pluralisme. (Disse statistikker om kandidater inden for køn og datalogi er begrænset, de bemærker, ved kun at bruge kategorierne "mand" og "kvinde", dermed udelukke personer, der identificerer sig på forskellige måder.)
Folk, der er interesserede i datafeminisme, oplyser forfatterne, bør også "værdsætte flere former for viden, " inklusive førstehåndsviden, der kan få os til at stille spørgsmålstegn ved tilsyneladende officielle data. de bør altid overveje den kontekst, hvori data genereres, og "gør arbejdet synligt", når det kommer til datavidenskab. Dette sidste princip, forskerne bemærker, taler om det problem, at selv når kvinder og andre udstødte mennesker bidrager til dataprojekter, de får ofte mindre kredit for deres arbejde.
For al bogens kritik af eksisterende systemer, programmer, og praksis, D'Ignazio og Klein er også omhyggelige med at inkludere eksempler på positive, vellykket indsats, såsom WomanStats-projektet, som er vokset og trives over to årtier.
"For folk, der er datafolk, men som er nye inden for feminisme, vi ønsker at give dem en meget tilgængelig introduktion, og give dem koncepter og værktøjer, de kan bruge i deres praksis, " D'Ignazio siger. "Vi forestiller os ikke, at folk allerede har feminisme i deres værktøjskasse. På den anden side, vi forsøger at tale med folk, der er meget indstillet på feminisme eller principper for social retfærdighed, og fremhæve for dem, hvordan datavidenskab både er problematisk, men kan samles i retfærdighedens tjeneste."
Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.