Videnskab
 science >> Videnskab >  >> Elektronik

At finde mennesker i video baseret på højde, klud farve, køn

Foreslået tilgang til personhentning ved hjælp af højde, klud farve og køn. Kredit:arXiv:1810.05080 [cs.CV] https://arxiv.org/abs/1810.05080

En særlig søgemetode lader dig finde mennesker i overvågningsvideo, bare baseret på deres beskrivelse. RT -overskriften lød, "AI -algoritme kan finde dig i CCTV -optagelser uden at bruge ansigtsgenkendelse." Men hvordan? Højde, køn, tøj, ikke ansigtstræk, er giveaways, via en kunstig intelligens algoritme.

Arbejdet afspejler potentialet i dyb læringsteknikker. RT er et nyttigt punkt for dem, der stadig kan sløre begrebet dyb læring med maskinlæring.

RT skrev, at i forskernes indsats, dyb læring rejste "ud over maskinlæring (hvor mønstre sættes ind i algoritmer og kræver overvågning) ved at inkorporere 'selvlæring'- for at træne et konvolutionsnervalt netværk (CNN) til at genkende blød biometri ved hjælp af computersyn."

RT og andre websteder rapporterede om teamet af forskere, der skabte værktøjet, der finder mennesker i CCTV -optagelser.

Hiren Galiyawala, Kenil Shah, Vandit Gajjar og Mehul S. Raval beskrev deres arbejde i deres papir, "Personhentning i overvågningsvideo ved hjælp af højde, Farve og køn, "indsendt i september og nu på arXiv. Forfattertilknytninger omfatter School of Engineering and Applied Science, Ahmedabad University og L.D. College of Engineering, begge i Indien.

Egenskaber som disse - højde, bygge, tøj - stoffarve, kludtype— og køn kaldes blød biometri. "Opgaven med personhentning i videoen er meget udfordrende på grund af okklusion, let stand, kamerakvalitet, positur, og zoom. Imidlertid, egenskaber som højde, klud farve, køn kan udledes af overvågningsvideo af lav kvalitet på afstand uden samarbejde fra emnet. Sådanne egenskaber er kendt som blød biometri, "skrev forfatterne.

Tristan Greene, TNW, gav et eksempel, det er en anmodning til kvinder iført røde skjorter, der er 153 cm høje. Resultatet ville være et videoklip, der er blevet indsnævret til rammer med personer, der opfylder disse kriterier.

Hvad var resultaterne? RT og andre websteder sagde, at algoritmen korrekt identificerede 28 personer ud af 41 i et datasæt med bløde biometriske attributter, og at forskerne sagde - med kun nogle mindre justeringer - nøjagtigheden kunne forbedres væsentligt.

Forfatterne i abstraktet sagde, at farve- og kønsmodellerne blev finjusteret ved hjælp af AlexNet. Sidstnævnte er et konvolutionsnervalt neuralt netværk (CNN), der får sit navn fra sin designer, Alex Krizhevsky. AlexNet er uddannet i mere end 1 million billeder fra ImageNet -databasen, sagde MathWorks.

"Netværket er 8 lag dybt og kan klassificere billeder i 1000 objektkategorier, såsom tastatur, mus, blyant, og mange dyr. Som resultat, netværket har lært rige funktionsrepræsentationer for en lang række billeder. "

Tristan Greene i TNW lavede en begrundelse for, hvorfor deres forskning har betydning.

Greene fandt deres arbejde spændende for dets konsekvenser for at finde savnede personer eller spore mistænkte kriminelle.

Men, han tilføjede, "måske lige så vigtigt er det, at dette er et legitimt svar på problemet med allestedsnærværende overvågning." Et alternativ til "allestedsnærværende" ville kun være det, der var relevant.

Greene sagde, "dette paradigme ville indebære brug af computere til at gennemsøge arkivmateriale, for kun dataene er i det mindste noget relevante. Det er en mindre forskel, men en, der kunne stave forskellen mellem regeringens voyeurisme og borgerbeskyttelse. "

Greene tænkte også, "hvis vi kunne føde video til et neuralt netværk og lade det indsnævre tingene til et par timers kompileret optagelser, det ville være muligt at spore mennesker nøjagtigt på tværs af flere overvågningsfeeds. "

© 2018 Science X Network




Varme artikler