Videnskab
 science >> Videnskab >  >> Elektronik

Forskerhold udvikler stemmelokaliseringsteknikker til smarte højttalere

Et eksempel på, hvordan en Amazon Alexa kunne bestemme en persons placering i et hjem. Kredit:Romit Roy Chowdhury

Smarthøjttalere – tænk, en Amazon Alexa eller et Google Home – tilbyder en bred vifte af muligheder for at hjælpe med at frigøre både vores tid og vores hænder. Vi kan høre morgennyhederne, mens vi børster tænder, bede om en vejrudsigt, mens du vælger en frakke, og indstil en timer til ovnen, mens du håndterer to varme pander på én gang. Ifølge Voicebot.ai, Alexa understøtter mere end 100, 000 færdigheder på verdensplan, men en opgave, den ikke har mestret, er at bestemme brugerens placering i hjemmet.

Denne lokaliseringsopgave var i fokus for et forskningshold fra University of Illinois i Urbana-Champaign's nyligt offentliggjorte papir, "Stemmelokalisering ved hjælp af vægrefleksioner i nærheden." Arbejdet blev accepteret til den 26. årlige internationale konference om mobil computing og netværk. I avisen, holdet – ledet af Coordinated Science Lab kandidatstuderende Sheng Shen – udforsker udviklingen af ​​VoLoc, et system, der bruger mikrofonarrayet på Alexa, samt rumekkoer af den menneskelige stemme, at udlede brugerens placering inde i hjemmet.

At kende en brugers placering i et hjem kan hjælpe en smartenhed til bedre at understøtte de nuværende tilgængelige færdigheder. For eksempel, efter at have modtaget kommandoer som "tænd lyset" eller "øg temperaturen, " Alexa skal i øjeblikket gætte hvilket lys og hvilket rum der er kernen i kommandoen. Ved at bruge en teknik kendt som omvendt triangulering, Shen og rådgiver Romit Roy Choudhury kommer tættere på stemmelokalisering.

"At anvende denne teknik på smarte højttalere indebærer en del udfordringer, " delte Shen, en el- og computeringeniørstuderende (ECE). "Først, vi skal adskille den direkte menneskelige stemme og hvert af rummets ekko fra mikrofonoptagelsen. Derefter, vi skal nøjagtigt beregne retningen for hvert af disse ekkoer. Begge udfordringer er svære, fordi mikrofonerne simpelthen optager en blanding af alle lydene tilsammen."

VoLoc adresserer disse forhindringer gennem en "align-and-cancel-algoritme", der iterativt isolerer retningerne for hvert af de ankommende stemmesignaler, og fra dem, omvendt triangulerer brugerens placering. Nogle aspekter af rummets geometri læres spontant, som så hjælper med trianguleringen. Selvom dette er et vigtigt gennembrud, Shen og Roy Choudhury planlægger snart at udvide forskningen til flere applikationer.

"Vores umiddelbare næste skridt er at bygge til den smarte højttalers referenceramme, ", forklarede Shen. "Dette kunne betyde at overlejre placeringerne, som leveret af VoLoc, på en plantegning for at fastslå, at brugeren er i vaskerummet. Alternativt hvis smarthøjttaleren opfanger lydene fra vaskemaskinen og tørretumbleren på samme sted som stemmekommandoen, det kan komme til samme konklusion."

Mulighederne for denne funktion er tilsyneladende uendelige og kunne forbedre Alexas nuværende evner.

"Konsekvenserne er vigtige, " sagde Roy Choudhury, en CSL-professor og W.J. "Jerry" Sanders III—Advanced Micro Devices, Inc. Stipendiat i elektro- og computerteknik. "Placering kan hjælpe Alexa med at forbedre talegenkendelse, da forskellige taleordforråd og -modeller kan indlæses. For eksempel, en kommando som "tilføj presserende til indkøbslisten" giver måske ikke mening, men hvis Alexa ved, at brugeren er i vaskerummet, Alexa kan muligvis udlede, at brugeren faktisk sagde "tilføj vaskemiddel til indkøbslisten".

Shen og Roy Choudhury erkender, at teknologien yderligere kan udhule privatlivets fred, ved at give virksomheder som Amazon og Google mulighed for at kigge nærmere ind i vores hjem og hverdag. Imidlertid, de mener også, at fordelene er afgørende, da kontekstbevidste smarte enheder kan blive afgørende understøttende teknologier til seniorers uafhængige liv og mere.

For eksempel, teknologien kunne bruges til at minde en bedsteforælder, der bor uafhængigt, om at tage deres medicin, når han eller hun passerer medicinskabet, eller for at minde et barn om at lukke for vandhanen, når de løber ud af badeværelset med den stadig kørende.

"Det er mere end at fortolke stemmekommandoer, " sagde Shen. "Det giver et ekstra sæt øjne, når det kommer til at tage sig af sine kære også."


Varme artikler