Et diagram over det foreslåede aldersvurderingssystem. Kredit:Agbo-Ajala &Viriri.
I løbet af de sidste par år, forskere har skabt et stigende antal machine learning (ML) -baserede ansigtsgenkendelsesteknikker, som kunne have mange interessante applikationer, for eksempel, forbedre overvågningsovervågningen, sikkerhedskontrol, og potentielt endda retsmedicinsk kunst. Ud over ansigtsgenkendelse, fremskridt inden for ML har også gjort det muligt at udvikle værktøjer til at forudsige eller estimere specifikke kvaliteter (f.eks. køn eller alder) af en person ved at analysere billeder af deres ansigter.
I en nylig undersøgelse, forskere ved University of Kwazulu-Natal, i Sydafrika, udviklet en maskinlæringsbaseret model til at estimere folks alder ved at analysere billeder af deres ansigter taget i tilfældige virkelige miljøer. Denne nye arkitektur blev introduceret i et papir udgivet af Spinger og præsenteret for et par dage siden på International Conference on Computational Collective Intelligence (ICCCI) 2019.
De fleste traditionelle tilgange til aldersklassificering fungerer kun godt, når man analyserer ansigtsbilleder taget i kontrollerede omgivelser, for eksempel, i laboratoriet eller i fotostudier. På den anden side, meget få af disse er i stand til at estimere alderen på mennesker på billeder taget i virkelige hverdagsmiljøer.
"Deep learning metoder har vist sig at være effektive til at løse dette problem, især med tilgængeligheden af både en stor mængde data til træning og avancerede maskiner, " skrev forskerne i deres papir. "I lyset af dette, vi foreslår en dyb indlæringsløsning til at vurdere alder ud fra virkelige ansigter."
Forskerteamet ved University of Kwazulu-Natal udviklede en dyb konvolutionsbaseret neuralt netværk (CNN) -baseret arkitektur med seks lag. Deres model blev trænet til at vurdere individers alder ud fra billeder af ansigter taget i ukontrollerede omgivelser. Arkitekturen opnår dette ved at lære, hvilke ansigtsrepræsentationer der er mest afgørende for aldersvurdering og ved at fokusere på disse særlige træk.
Billedforbehandlingsfasen. Kredit:Agbo-Ajala &Viriri.
For at forbedre ydeevnen af deres CNN-baserede model, forskerne fortrænede det på et stort datasæt kaldet IMDB-WIKI, som indeholder over en halv million billeder af ansigter taget fra IMDB og Wikipedia, mærket med hvert fags alder. Denne indledende træning gav dem mulighed for at tilpasse deres arkitektur til ansigts billedindhold.
Efterfølgende forskerne stemte modellen ved hjælp af billeder fra yderligere to databaser, nemlig MORPH-II og OUI-Adience, træne den til at opfange særheder og forskelle. MORPH-II indeholder cirka 70, 000 mærkede billeder af ansigter, mens OUI-Adience indeholder 26, 580 ansigtsbilleder taget i ideelle virkelige miljøer.
Da de vurderede deres model på billeder taget i ukontrollerede miljøer, forskerne fandt ud af, at denne omfattende træning førte til bemærkelsesværdig præstation. Deres model opnåede state-of-the-art resultater, bedre end flere andre CNN-baserede metoder til aldersvurdering.
"Vores eksperimenter viser effektiviteten af vores metode til aldersvurdering i naturen, når de evalueres på OUI-Adience benchmark, som vides at indeholde billeder af ansigter erhvervet under ideelle og ubegrænsede forhold, " skrev forskerne. "Den foreslåede aldersklassificeringsmetode opnår nye avancerede resultater, med en forbedring af nøjagtigheden på 8,6 procent (nøjagtig) og 3,4 procent (engangs) i forhold til det bedst rapporterede resultat på OUI-Adience-datasættet."
I fremtiden, den nye CNN-baserede arkitektur udviklet af disse forskere kunne muliggøre mere effektive implementeringer af aldersvurdering i en række virkelige omgivelser. Teamet planlægger også at tilføje lag til modellen og træne den på andre datasæt af ansigtsbilleder taget i ukontrollerede miljøer, så snart de bliver tilgængelige, for yderligere at forbedre sin ydeevne.
© 2019 Science X Network