Videnskab
 science >> Videnskab >  >> Elektronik

Avanceret teknologi kan indikere, hvordan hjernen lærer ansigter

Virkelige verden, ubegrænsede billeder som disse (a) bruges til at træne ansigtsgenkendelsesnetværk. Test for undersøgelsen blev udført på stærkt kontrollerede laserscanningsdata, der varierede efter synspunkt (b, kolonner), belysning (b, rækker) og karikaturlignende identitetsstyrke (c). Kredit:University of Texas i Dallas

Ansigtsgenkendelsesteknologien har udviklet sig hurtigt i de sidste fem år. Mens forskere fra University of Texas i Dallas prøver at fastslå, hvordan computere er blevet lige så gode som folk til opgaven, de kaster også lys over, hvordan den menneskelige hjerne sorterer information.

UT Dallas forskere har analyseret ydeevnen for den seneste echelon af ansigtsgenkendelsesalgoritmer, afslører den overraskende måde, disse programmer – som er baseret på maskinlæring – fungerer. Deres studie, udgivet online 12. november in Nature Machine Intelligence , viser, at disse sofistikerede computerprogrammer - kaldet deep convolutional neurale netværk (DCNN'er) - konfigurerede, hvordan man identificerer ansigter anderledes, end forskerne forventede.

"I de sidste 30 år, folk har antaget, at computerbaserede visuelle systemer slipper af med al den billedspecifikke information – vinkel, belysning, udtryk og så videre, " sagde Dr. Alice O'Toole, seniorforfatter af undersøgelsen og Aage og Margareta Møller -professoren på School of Behavioral and Brain Sciences. "I stedet, Algoritmerne beholder disse oplysninger, mens de gør identiteten vigtigere, hvilket er en grundlæggende ny måde at tænke problemet på."

I maskinlæring, computere analyserer store mængder data for at lære at genkende mønstre, med det mål at kunne træffe beslutninger med minimalt menneskeligt input. O'Toole sagde, at de fremskridt, der er gjort af maskinlæring til ansigtsgenkendelse siden 2014, har "ændret alt med kvantespring."

"Ting, der aldrig kunne lade sig gøre før, som har hæmmet computersynsteknologi i 30 år, blev ikke kun gennemførligt, men ret nemt, "O'Toole sagde. "Fangsten er, at ingen forstod, hvordan det virker."

Tidligere generations algoritmer var effektive til at genkende ansigter, der kun havde mindre ændringer fra det billede, de allerede kendte. Nuværende teknologi, imidlertid, kender en identitet godt nok til at overvinde ændringer i udtrykket, synspunkt eller udseende, såsom at fjerne glas.

"Disse nye algoritmer fungerer mere som dig og mig, "O'Toole sagde. "Det er til dels fordi de har akkumuleret en enorm mængde erfaring med variationer i, hvordan en identitet kan fremstå. Men det er ikke hele billedet«.

O'Tooles team gik i gang med at lære, hvordan læringsalgoritmerne fungerer – både for at underbygge tilliden til deres resultater og, som hovedforfatter Matthew Hill forklarede, at kaste lys over, hvordan den visuelle cortex i den menneskelige hjerne udfører den samme opgave.

"Strukturen af ​​denne type neurale netværk blev oprindeligt inspireret af, hvordan hjernen behandler visuel information, sagde Hill, en doktorand i kognition og neurovidenskab. "Fordi den udmærker sig ved at løse de samme problemer, som hjernen gør, det kan give indsigt i, hvordan hjernen løser problemet.«

Oprindelsen af ​​den type neurale netværksalgoritme, som holdet studerede, går tilbage til 1980, men kraften i neurale netværk voksede eksponentielt mere end 30 år senere.

"Tidligt i dette årti, to ting skete:Internettet gav dette program millioner af billeder og identiteter at arbejde med – utrolige mængder let tilgængelige data – og computerkraften voksede, så det, i stedet for at have to eller tre lag af 'neuroner' i det neurale netværk, du kan have mere end 100 lag, som dette system gør nu, " sagde O'Toole.

På trods af algoritmens tilsigtede formål, omfanget af dets beregninger - som i det mindste tæller titusinder af millioner - betyder, at videnskabsmænd ikke er i stand til at forstå alt, hvad det gør.

"Selvom algoritmen blev designet til at modellere neuronernes adfærd i hjernen, vi kan ikke holde styr på alt, der er gjort mellem input og output, " sagde Connor Parde, en forfatter til papiret og en doktorand i kognition og neurovidenskab. "Så vi er nødt til at fokusere vores forskning på outputtet."

For at demonstrere algoritmens muligheder, holdet brugte karikaturer, ekstreme versioner af en identitet, som Y. Ivette Colón BS'17, en forskningsassistent og en anden forfatter til undersøgelsen, beskrevet som "den mest 'du'-version af dig."

"Karikaturer overdriver din unikke identitet i forhold til alle andres, " sagde O'Toole. "På en måde, det er præcis, hvad algoritmen ønsker at gøre:fremhæve det, der gør dig anderledes end alle andre."

Til forskernes overraskelse, DCNN udmærkede sig faktisk ved at forbinde karikaturer med deres tilsvarende identiteter.

"I betragtning af disse forvrængede billeder med funktioner ude af proportioner, netværket forstår, at det er de samme funktioner, der gør en identitet karakteristisk og korrekt forbinder karikaturen med identiteten, "O'Toole sagde. "Den ser den karakteristiske identitet på måder, som ingen af ​​os havde forventet."

Så, efterhånden som edb -systemer begynder at være ens - og lejlighedsvis, overgå – menneskers ansigtsgenkendelsespræstation, kunne algoritmens grundlag for at sortere information ligne det, den menneskelige hjerne gør?

At finde ud af, der er behov for en bedre forståelse af den menneskelige visuelle cortex. Den mest detaljerede tilgængelige information er via billeder taget via funktionel MR, som kan bruges til at forestille hjernens aktivitet, mens et emne udfører en mental opgave. Hill beskrev fMRI som "for støjende" til at se de små detaljer.

"Opløsningen af ​​en fMRI er ikke i nærheden af, hvad du behøver for at se, hvad der sker med aktiviteten af ​​individuelle neuroner, "Sagde Hill." Med disse netværk, du har enhver beregning. Det giver os mulighed for at spørge:Kan identiteter organiseres på denne måde i vores sind?"

O'Tooles laboratorium vil løse det spørgsmål næste gang, takket være en nylig bevilling på mere end $1,5 millioner over fire år fra National Eye Institute of the National Institutes of Health.

"NIH har givet os det biologiske spørgsmål:Hvor relevante er disse resultater for menneskelig visuel opfattelse?" hun sagde. "Vi har fire års finansiering til at finde et svar."


Varme artikler