Kredit:IBM
Er du nogensinde blevet uretfærdigt behandlet? Hvordan fik det dig til at føle? Sandsynligvis ikke for godt. De fleste mennesker er generelt enige om, at en mere retfærdig verden er en bedre verden, og vores AI-forskere kunne ikke være mere enige. Det er derfor, vi udnytter videnskabens kraft til at skabe AI-systemer, der er mere retfærdige og nøjagtige.
Mange af vores seneste fremskridt inden for kunstig intelligens har frembragt bemærkelsesværdige muligheder for computere til at udføre stadigt mere sofistikerede og vigtige opgaver, som at oversætte tale på tværs af sprog for at bygge bro mellem kommunikation på tværs af kulturer, forbedre komplekse interaktioner mellem mennesker og maskiner, og automatisk genkendelse af videoindhold for at hjælpe med sikkerhedsapplikationer.
Meget af kraften ved AI i dag kommer fra brugen af datadrevet dyb læring til at træne stadig mere præcise modeller ved at bruge voksende mængder af data. Imidlertid, styrken af disse teknikker kan også være en svaghed. AI-systemerne lærer, hvad de bliver undervist i, og hvis de ikke undervises med robuste og forskellige datasæt, nøjagtighed og retfærdighed kan være i fare. Af den grund, IBM, sammen med AI-udviklere og forskningsmiljøet, skal være betænksomme over, hvilke data vi bruger til træning. IBM er fortsat engageret i at udvikle AI-systemer for at gøre verden mere retfærdig.
Udfordringen med at træne AI kommer til udtryk på en meget tydelig og dybtgående måde med ansigtsgenkendelsesteknologi. I dag, der kan være vanskeligheder med at lave ansigtsgenkendelsessystemer, der opfylder fairness-forventninger. Hjertet af problemet ligger ikke i selve AI-teknologien, i sig selv, men med hvordan de AI-drevne ansigtsgenkendelsessystemer trænes. For at ansigtsgenkendelsessystemerne kan fungere som ønsket – og resultaterne bliver stadig mere præcise – skal træningsdata være forskelligartede og tilbyde en bred dækning. For eksempel, træningsdatasættene skal være store nok og forskellige nok til, at teknologien lærer alle de måder, hvorpå ansigter er forskellige, til nøjagtigt at genkende disse forskelle i en række forskellige situationer. Billederne skal afspejle fordelingen af træk i ansigter, vi ser i verden.
Kredit:IBM
Hvordan måler og sikrer vi mangfoldighed for menneskelige ansigter? På den ene side, vi er bekendt med, hvordan ansigter er forskellige efter alder, køn, og hudfarve, og hvordan forskellige ansigter kan variere på tværs af nogle af disse dimensioner. Meget af fokus på ansigtsgenkendelsesteknologi har været på, hvor godt den klarer sig inden for disse egenskaber. Men, som tidligere undersøgelser har vist, disse egenskaber er blot en brik i puslespillet og ikke helt tilstrækkelige til at karakterisere den fulde mangfoldighed af menneskelige ansigter. Dimensioner som ansigtssymmetri, ansigtskontrast, stillingen ansigtet er i, længden eller bredden af ansigtets egenskaber (øjne, næse, pande, osv.) er også vigtige.
I dag, IBM Research udgiver et nyt stort og mangfoldigt datasæt kaldet Diversity in Faces (DiF) for at fremme studiet af retfærdighed og nøjagtighed i ansigtsgenkendelsesteknologi. Den første af sin slags tilgængelig for det globale forskningssamfund, DiF leverer et datasæt med annoteringer af 1 million menneskelige ansigtsbilleder. Ved at bruge offentligt tilgængelige billeder fra YFCC-100M Creative Commons-datasættet, vi annoterede ansigterne ved hjælp af 10 veletablerede og uafhængige kodningsskemaer fra den videnskabelige litteratur. [1-10] Kodningsskemaerne omfatter hovedsageligt objektive mål for menneskelige ansigter, såsom kraniofaciale træk, samt mere subjektive kommentarer, såsom menneskemærkede forudsigelser af alder og køn. Vi tror ved at udtrække og frigive disse annoteringer til ansigtskodning på et stort datasæt med 1 million billeder af ansigter, vi vil fremskynde studiet af mangfoldighed og dækning af data til AI-ansigtsgenkendelsessystemer for at sikre mere retfærdige og præcise AI-systemer. Dagens udgivelse er simpelthen det første skridt.
Vi mener, at DiF-datasættet og dets 10 kodningsskemaer er et startpunkt for forskere over hele kloden, der studerer ansigtsgenkendelsesteknologien. De 10 ansigtskodningsmetoder inkluderer kraniofacial (f.eks. hovedlængde, næse længde, pandehøjde), ansigtsforhold (symmetri), visuelle egenskaber (alder, køn), og positur og opløsning, blandt andre. Disse skemaer er nogle af de stærkeste identificeret af den videnskabelige litteratur, bygger et solidt fundament for vores kollektive viden.
Vores indledende analyse har vist, at DiF-datasættet giver en mere afbalanceret fordeling og bredere dækning af ansigtsbilleder sammenlignet med tidligere datasæt. Desuden, indsigten opnået fra den statistiske analyse af de 10 indledende kodningsskemaer på DiF-datasættet har fremmet vores egen forståelse af, hvad der er vigtigt for at karakterisere menneskelige ansigter og gjort os i stand til at fortsætte vigtig forskning i måder at forbedre ansigtsgenkendelsesteknologien på.
Datasættet er i dag tilgængeligt for det globale forskningssamfund efter anmodning. IBM er stolte af at gøre dette tilgængeligt, og vores mål er at hjælpe med at fremme vores kollektive forskning og bidrage til at skabe AI-systemer, der er mere retfærdige.
Mens IBM Research er forpligtet til at fortsætte undersøgelse og undersøgelse af mere retfærdige ansigtsgenkendelsessystemer, vi tror ikke på, at vi kan gøre det alene. Med dagens udgivelse, vi opfordrer andre til at bidrage til den voksende mængde forskning og fremme denne vigtige videnskabelige dagsorden.
For at anmode om adgang til DiF-datasættet, besøg vores hjemmeside. For at lære mere om DiF, læs vores avis, "Mangfoldighed i ansigter."
Denne historie er genudgivet med tilladelse fra IBM Research. Læs den originale historie her.