Videnskab
 science >> Videnskab >  >> Elektronik

Skyld eller plastikpose dukker? Uddannet computermodel kender forskellen

Forskere optog skudlignende lyde på steder, hvor der var sandsynlighed for, at våben blev affyret, hvilket omfattede en udendørs park. Kredit:Florida Atlantic University

Ifølge Gun Violence Archive har der været 296 masseskyderier i USA i år. Desværre er 2021 på vej til at blive USA's mest dødbringende år med våbenvold i de sidste to årtier.

At skelne mellem en farlig lydbegivenhed som en pistolaffyring og en ikke-livstruende hændelse, såsom en plastikpose, der sprænger, kan betyde forskellen mellem liv og død. Derudover kan det også afgøre, om der skal indsættes offentlige sikkerhedsarbejdere. Mennesker, såvel som computere, forveksler ofte lyden af ​​en plastikpose, der springer, og rigtige skudlyde.

I løbet af de sidste par år har der været en vis tøven over implementeringen af ​​nogle af de velkendte tilgængelige akustiske skuddetektorsystemer, da de kan være dyre og ofte upålidelige.

I en eksperimentel undersøgelse fokuserede forskere fra Florida Atlantic University's College of Engineering and Computer Study på at adressere pålideligheden af ​​disse detektionssystemer, som det relaterer til den falske positive rate. En models evne til at skelne lyde korrekt, selv i de mest subtile scenarier, vil adskille en veltrænet model fra en, der ikke er særlig effektiv.

Med den skræmmende opgave at tage højde for alle lyde, der ligner en skudlyd, skabte forskerne et nyt datasæt bestående af lydoptagelser af plastikposeeksplosioner indsamlet over en række forskellige miljøer og forhold, såsom plastikposestørrelse og afstand fra optagelsen mikrofoner. Optagelserne fra lydklippene varierede fra 400 til 600 millisekunders varighed.

Forskere udviklede også en klassifikationsalgoritme baseret på et konvolutionelt neuralt netværk (CNN) som en baseline for at illustrere relevansen af ​​denne dataindsamlingsindsats. Dataene blev derefter brugt sammen med et skudlyddatasæt til at træne en klassifikationsmodel baseret på en CNN til at skelne livstruende skudbegivenheder fra ikke-livstruende plastikposeeksplosionsbegivenheder.

Forskere brugte et ekkofrit kammer som et af miljøerne, som giver "rene", uforstyrrede prøver, der tilføjede en masse information til CNN, hvilket igen gjorde modellen mere robust. Kredit:Florida Atlantic University

Resultaterne af undersøgelsen, offentliggjort i tidsskriftet Sensors, viser, hvordan falske skudlyde nemt kan forvirre et skudlydsdetektionssystem. 75 procent af pop-lydene i plastikposer blev fejlklassificeret som skudlyde. Den dybe læringsbaserede klassifikationsmodel trænet med et populært urbant lyddatasæt indeholdende skudlyde kunne ikke skelne plastikpose-poplyde fra skudlyde. Men når plastikposens pop-lyde blev injiceret i modeltræning, opdagede forskere, at CNN-klassifikationsmodellen klarede sig godt til at skelne faktiske skudlyde fra plastikposelyde.

"Som mennesker bruger vi yderligere sensoriske input og tidligere erfaringer til at identificere lyde. Computere er på den anden side trænet til at dechifrere information, der ofte er irrelevant eller umærkelig for menneskelige ører," siger Hanqi Zhuang, Ph.D., seniorforfatter. , professor og formand, Institut for Elektroteknik og Datalogi, Ingeniørhøjskolen og Datalogi. "I lighed med hvordan flagermus snupper rundt om objekter, mens de transmitterer høje lydbølger, der vil hoppe tilbage til dem med forskellige tidsintervaller, brugte vi forskellige miljøer til at give maskinlæringsalgoritmen en bedre opfattelsesfølelse af differentieringen af ​​de nært beslægtede lyde. "

Til undersøgelsen blev der optaget skudlignende lyde på steder, hvor der var sandsynlighed for, at våben blev affyret, hvilket omfattede i alt otte indendørs og udendørs steder. Dataindsamlingsprocessen startede med at eksperimentere med forskellige typer poser, med affaldsbeholdere udvalgt som de bedst egnede. De fleste af lydklippene blev optaget med seks optageenheder. For at kontrollere, i hvilket omfang en lydklassificeringsmodel kunne forveksles af falske skud, trænede forskere modellen uden at udsætte den for pop-lyde i plastikposer.

Der blev oprindeligt brugt 374 skudprøver til at træne modellen, som blev hentet fra bylyddatabasen. Forskere brugte 10 klasser fra databasen (pistolskud, hundegøen, børn, der leger, bilhorn, klimaanlæg, gademusik, sirene, motor i tomgang, hammerhammer og boring). Efter træning blev modellen derefter brugt til at teste dens evne til at afvise plastikpose-poplyde som ægte skudlyde.

"Den høje procentdel af fejlklassificering indikerer, at det er meget vanskeligt for en klassifikationsmodel at skelne skudlignende lyde som dem fra plastikpose-poplyde og rigtige skudlyde," sagde Rajesh Baliram Singh, førsteforfatter og ph.d. studerende på FAU's Institut for Elektroteknik og Datalogi. "Dette garanterer processen med at udvikle et datasæt, der indeholder lyde, der ligner rigtige skudlyde."

Ved skuddetektion kan det føre til et mere effektivt skuddetektionssystem at have en database med en bestemt lyd, der kan forveksles med skudlyd, men alligevel er rig på mangfoldighed. Dette koncept motiverede forskerne til at oprette en database med eksplosionslyde i plastikposer. Jo højere diversiteten af ​​den samme lyd er, desto større er sandsynligheden for, at maskinlæringsalgoritmen vil registrere den specifikke lyd korrekt.

"Forbedring af ydeevnen af ​​en algoritme til registrering af skud, især for at reducere dens falske positive rate, vil reducere chancerne for at behandle uskadelige lydudløserhændelser som farlige lydbegivenheder, der involverer skydevåben," sagde Stella Batalama, Ph.D., dekan, College i ingeniørvidenskab og datalogi. "Dette datasæt, udviklet af vores forskere, sammen med den klassifikationsmodel, de trænede til skud- og skudlignende lyde, er et vigtigt skridt, der fører til meget færre falske positiver og til at forbedre den generelle offentlige sikkerhed ved kun at indsætte kritisk personale, når det er nødvendigt."

Varme artikler