En almindelig tilgang til billedgenkendelse er objektdetektion, som involverer identifikation af specifikke objekter i et billede. Dette gøres typisk ved hjælp af en teknik kaldet convolutional neural networks (CNN'er), en type deep learning algoritme, der er specielt designet til at genkende mønstre i billeder.
I et CNN opdeles billedet først i mindre områder, og hver region analyseres af en række filtre. Disse filtre er designet til at identificere specifikke funktioner, såsom kanter, hjørner og teksturer. Filtrenes output ledes derefter gennem en række poolingslag, som reducerer dimensionaliteten af dataene og gør det lettere at identificere mønstre.
Efter poolingslagene sendes dataene gennem et fuldt forbundet lag, som er et traditionelt neuralt netværkslag, der kombinerer de funktioner, der identificeres af de foldede lag, og klassificerer billedet. Outputtet af det fuldt forbundne lag er en vektor af sandsynligheder, der angiver sandsynligheden for, at billedet indeholder et specifikt objekt.
Ved at træne CNN på et stort datasæt af billeder, der er blevet mærket med deres tilsvarende objekter, er det muligt at lære computeren at genkende specifikke objekter i nye billeder.
En anden tilgang til billedgenkendelse er ansigtsgenkendelse, som involverer at identificere specifikke ansigter i et billede. Dette gøres typisk ved hjælp af en teknik kaldet Eigenfaces, som involverer at skabe et sæt basisbilleder, der repræsenterer hovedtrækkene i et ansigt.
For at identificere et ansigt i et nyt billede projiceres billedet først på basisbillederne, og den resulterende vektor sammenlignes med vektorerne af kendte ansigter. Ansigtet med den mest lignende vektor identificeres derefter som det sandsynlige match.
Billedgenkendelse er et felt i hastig udvikling, og der udvikles konstant nye teknikker for at forbedre nøjagtigheden og effektiviteten af objekt- og ansigtsgenkendelse. Disse teknikker bruges i en lang række applikationer, såsom sikkerhedssystemer, medicinsk billedbehandling og autonome køretøjer.
Sidste artikelHvorfor de kæmper:USA og Kina slås om højteknologi
Næste artikelNyttigt eller uhyggeligt? Maskiner foreslår Gmail-svar