Videnskab
 science >> Videnskab >  >> Elektronik

Neurale netværk lærte at genkende lignende objekter på videoer uden forringelse af nøjagtighed

AI vil tjene til at udvikle et netværkskontrolsystem, der ikke kun opdager og reagerer på problemer, men også kan forudsige og undgå dem. Kredit:CC0 Public Domain

Andrey Savchenko, Professor ved Higher School of Economics (HSE University), har udviklet en metode, der kan hjælpe med at forbedre billedidentifikation på videoer. I sit projekt, et netværk blev undervist af en ny algoritme og kan nu træffe beslutninger om billedgenkendelse og klassificering med en hastighed 10 gange hurtigere end før. Denne forskning blev præsenteret i papiret "Sekventielle trevejsbeslutninger i billedgenkendelse i flere kategorier med dybe funktioner baseret på afstandsfaktor" offentliggjort i Informationsvidenskab .

Neurale netværk lærte at identificere mennesker og dyr i videoer for længe siden. Kunstige neuroner kan lære ved at huske, hvordan et bestemt objekt ser ud i et billede. Som regel, forskere tager en åben database med fotos (f.eks. ImageNet, Steder, osv.) og brug det til at undervise i et neuralt netværk. For at fremskynde beslutningsprocessen, vores algoritme er indstillet til kun at vælge nogle af prøvebillederne, eller fokus på et begrænset antal træk. Komplikationer kan opstå, når objekter af forskellige klasser er på det samme foto, og der er kun et lille antal træningseksempler for hver kategori.

Den nye algoritme kan nu genkende billeder uden væsentlig nøjagtighedsforringelse ved anvendelse af en sekventiel trevejs beslutningsproces. Ved at anvende denne tilgang, et neuralt netværk kan analysere simple billeder på en måde for klart genkendelige objekter, mens objekter, der er vanskelige at identificere, kan få en mere detaljeret undersøgelse.

"Hvert foto kan beskrives ved bogstaveligt talt tusindvis af funktioner. Så, det ville ikke give meget mening at sammenligne alle funktionerne i et givet inputbillede med et grundlæggende træningseksempel, da de fleste prøver ikke ville ligne det analyserede billede. Så, vi sammenlignede i første omgang kun nogle få af de vigtige funktioner, og læg uddannelsesinstanserne til side, som naturligvis ikke kan behandles som endelige løsninger. Som resultat, træningsprøven bliver mindre, og der er kun få eksempler tilbage. I den næste fase, vi ville øge antallet af funktioner for de resterende billeder, og gentag derefter denne proces, indtil der kun er en klasse tilbage, "Noterede prof. Savchenko.

Denne tilgang reducerede tiden for anerkendelse med 1,5 til 10 gange, sammenlignet med almindelige klassifikatorer og kendte sekventielle trevejsbeslutninger i flere kategorier. Som resultat, denne teknologi kunne bruges i fremtiden på mobile enheder og andre grundlæggende gadgets.


Varme artikler