Videnskab
 science >> Videnskab >  >> Elektronik

Patentforedrag:Slap af, ingen ville blive forstyrret af dine stemmekommandoer i det offentlige rum

Kredit:PCT/CN2017/087767

Tavse stemmekommandoer? Microsoft er på det, mange tak. De har indgivet et patent "Silent Voice Input." Microsoft er, i dette patent, ser på et modul, der kan registrere en brugers stemmekommandoer, der ikke kan registreres af nogen omkring brugeren.

Siri og Cortana er blevet ved med at gå fra styrke til styrke, men som Windows Central bemærkede, "ingen virksomhed ser ud til at have overvejet, hvor akavet det kan være at udstede kommandoer offentligt."

I hviskende, vi anvender egressiv tale, i, at vi ånder ud. I denne idé, en stemmeinput bemærkes slet ikke af omgivelserne. Sammenlignet med konventionelle stemmeløsninger baseret på normal tale eller hvisken, den tavse stemmeinputmetode involverer brugen af ​​"ingressiv stemme" under brugerens indåndingsproces.

Tænk over det. Brug af tale-højt-kommandoer i et offentligt rum har en tendens til at gøre brugeren selvbevidst. Der er et teknisk problem, og der er et "mentalt" problem, sagde Masaaki Fukumoto, ved en præsentation i oktober i Berlin.

Man kan være selvbevidst om at lække private oplysninger; man kan være selvbevidst om irriterende mennesker i nærheden, der er fremmede; og man kan være selvbevidst om at tage fejl af at tale med ingen andre i nærheden.

"Hej, alle sammen, dette er tavs stemme." I en video af en præsentation, det var ord på en skærm. Men man kunne ikke høre de samme ord komme fra hans mund. Bifald. "Så, " fortsatte han, "Dette er ingressiv tale."

Et modul kan registrere "tavse" stemmekommandoer - lydløs står i anførselstegn. OKAY, det er ikke den slags hvisken din ven glider ind i i biografen, og den siger ikke "Psst!"

Mallory Locklear ind Engadget :"I stedet for en typisk hvisken, hvor dit åndedræt bevæger sig ud af din mund, med lydløs stemmeinput, du skal inhalere, mens du hvisker. Det kaldes ingressiv luftstrøm, og Microsoft siger, at det vil forhindre brugernes hviskede stemmer i at blive forvrænget. Og det er et problem, for at denne metode fungerer, du skal lægge munden helt tæt på mikrofonen. Vi taler en til to millimeter tæt på."

Denne idé handler om et "apparat" placeret tæt på munden.

Sådan diskuteres det i patentet:

"Ved at placere apparatet meget tæt på brugerens mund med et ultralille mellemrum mellem mikrofonen og apparatet, den foreslåede lydløs stemmeinput-løsning kan realisere en meget lille stemmelækage, og derved give brugeren mulighed for at bruge ultralav stemmeinput i offentlige og mobile situationer, uden at forstyrre omkringliggende mennesker."

Med andre ord, som fra Jez Corden i Windows Central , "den" tavse "inputmetode kan registrere hvisken og ekstrapolere stemmekommandoer fra luftstrømmen, der skabes, mens du taler ord."

Modulet, sagde Corden, kunne tilhøre forskellige enheder såsom smarture, telefoner, headset mikrofoner og fjernbetjening til tv.

Forestil dig, at du holder en ring til munden - i det mindste ville andre ved første øjekast antage, at du holder en ring til munden; du beder den tjekke mail.

Godt, dette er selve eksemplet, der styrker Cal Jeffreys pointe TechSpot :Foreslår patentet noget, der ville være mindre byrdefuldt for de selvbevidste forsøg på stemmekommandoer?

Jeffrey skrev, "Det kan diskuteres, om nogen ville føle sig mere eller mindre trygge ved at holde deres ur helt op til munden frem for blot at udsende en hørbar verbal kommando. Alternativt, det kan være nyttigt til tidspunkter, hvor normale stemmeniveauer ikke er helt passende, som når andre sover."

I øvrigt, patentansøgninger bliver måske ikke til egentlige "stemmeinput"-løsninger.

Patentudvikling er ikke det eneste problem; der er et punkt mere ved denne patentansøgning. Laurent Giret kl OnMSFT kommenterede, at det ikke var klart, om den "stille stemme"-tilgang som beskrevet i patentet "virkelig kunne ændre, hvordan vi interagerer med digitale assistenter."

Han sagde, at de fleste brugere sandsynligvis bare vil "fortsætte med at opføre sig offentligt og fortsætte med at gøre tingene på den gamle måde. Og fra i dag, det er stadig ofte hurtigere at bruge berøringsinput end stemmekommandoer, der ikke altid bliver forstået ordentligt."

Grundlæggende den gode nyhed er i det mindste, at dataloger er klar over, at muligheden lokker for at komme med en løsning, der vil hjælpe de selvbevidste til at føle sig bedre til at udstede stemmekommandoer i offentligheden.

© 2019 Science X Network




Varme artikler