Videnskab
 Science >> Videnskab >  >> Elektronik

Forklarer:Hvordan computere "ser" ansigter og andre objekter

Computere kan "se" ansigter og andre objekter gennem en proces, der kaldes billedgenkendelse. Dette involverer brug af matematiske teknikker til at analysere digitale billeder og identificere mønstre og funktioner i dem.

En almindelig tilgang til billedgenkendelse er objektdetektion, som involverer identifikation af specifikke objekter i et billede. Dette gøres typisk ved hjælp af en teknik kaldet convolutional neural networks (CNN'er), en type deep learning algoritme, der er specielt designet til at genkende mønstre i billeder.

I et CNN opdeles billedet først i mindre områder, og hver region analyseres af en række filtre. Disse filtre er designet til at identificere specifikke funktioner, såsom kanter, hjørner og teksturer. Filtrenes output ledes derefter gennem en række poolingslag, som reducerer dimensionaliteten af ​​dataene og gør det lettere at identificere mønstre.

Efter poolingslagene sendes dataene gennem et fuldt forbundet lag, som er et traditionelt neuralt netværkslag, der kombinerer de funktioner, der identificeres af de foldede lag, og klassificerer billedet. Outputtet af det fuldt forbundne lag er en vektor af sandsynligheder, der angiver sandsynligheden for, at billedet indeholder et specifikt objekt.

Ved at træne CNN på et stort datasæt af billeder, der er blevet mærket med deres tilsvarende objekter, er det muligt at lære computeren at genkende specifikke objekter i nye billeder.

En anden tilgang til billedgenkendelse er ansigtsgenkendelse, som involverer at identificere specifikke ansigter i et billede. Dette gøres typisk ved hjælp af en teknik kaldet Eigenfaces, som involverer at skabe et sæt basisbilleder, der repræsenterer hovedtrækkene i et ansigt.

For at identificere et ansigt i et nyt billede projiceres billedet først på basisbillederne, og den resulterende vektor sammenlignes med vektorerne af kendte ansigter. Ansigtet med den mest lignende vektor identificeres derefter som det sandsynlige match.

Billedgenkendelse er et felt i hastig udvikling, og der udvikles konstant nye teknikker for at forbedre nøjagtigheden og effektiviteten af ​​objekt- og ansigtsgenkendelse. Disse teknikker bruges i en lang række applikationer, såsom sikkerhedssystemer, medicinsk billedbehandling og autonome køretøjer.

Varme artikler