Videnskab
 science >> Videnskab >  >> Elektronik

Hvorfor folk vil slå maskiner i at genkende tale i lang tid

Kredit:Pathdoc/Shutterstock.cim

Forestil dig en verden, hvor Siri altid forstår dig, Google Translate fungerer perfekt, og de to skaber noget, der ligner et oversættelseskredsløb i Doctor Who-stil. Forestil dig at kunne kommunikere frit, uanset hvor du går (ikke at skulle mumle på skolefransk til din parisiske tjener). Det er en attraktiv, men stadig fjern udsigt. En af flaskehalsene i at flytte denne virkelighed fremad er variation i sproget, især talesprog. Teknologien kan ikke helt klare det.

mennesker, på den anden side, er fantastisk gode til at håndtere variationer i sproget. Vi er så gode, faktisk, at vi virkelig tager til efterretning, når tingene indimellem går i stykker. Da jeg besøgte New Zealand, Jeg troede et stykke tid, at folk kaldte mig "kæledyr, "en Newcastle-lignende hengivenhed. De var, faktisk, siger bare mit navn, Klappe. Mit aha-øjeblik skete på en kaffebar ("Flad hvid til kæledyr!" gav mig en pause).

Denne historie illustrerer, hvordan forskellige accenter af engelsk har lidt forskellige vokaler - et velkendt faktum. Men lad os prøve at forstå, hvad der skete, da jeg mishørte Kiwi-udtalen af ​​Pat som kæledyr . Der er en vis række af lyde, som vi forbinder med vokaler, synes godt om -en eller e . Disse intervaller er ikke absolutte. Hellere, deres grænser varierer, for eksempel mellem forskellige accenter. Når lytterne ikke kan tilpasse sig dette, som jeg gjorde i dette tilfælde, kortlægningen af ​​lyd til betydning kan forvrænges.

Man kunne, møjsommeligt, lære forskellige accenter til et talegenkendelsessystem, men accentvariation er kun toppen af ​​isbjerget. Vokallyde kan også variere afhængigt af vores alder, køn, social klasse, etnicitet, seksuel orientering, niveau af forgiftning, hvor hurtigt vi taler, hvem vi taler med, uanset om vi er i et støjende miljø eller ej ... listen fortsætter bare, og på.

Sagens kerne/skurke

Tænk på, at en nylig undersøgelse, jeg var involveret i, viste, at selv flytning (eller ej) kan påvirke ens vokaler. Specifikt, der er en sammenhæng mellem, hvordan nordengelsktalende udtaler vokalen i ord som f.eks crux , og hvor mange gange de er flyttet i det sidste årti. Folk, der slet ikke har bevæget sig, er mere tilbøjelige til at udtale crux det samme som skurke , som er den traditionelle nordengelske udtale. Men de, der har flyttet sig fire gange eller mere, er mere tilbøjelige til at have forskellige vokaler i de to ord, tilsvarende i det sydlige England.

Der er, selvfølgelig, intet om handlingen at flytte, der forårsager dette. Men at flytte hus flere gange er korreleret med andre livsstilsfaktorer, for eksempel interaktion med flere mennesker, herunder mennesker med forskellige accenter, som kan påvirke vores måde at tale på.

Andre kilder til variation kan have at gøre med sproglige faktorer, såsom ordstruktur. Et slående eksempel kommer fra ordpar som f.eks lineal , betyder "måleanordning" og lineal , betyder "leder".

Disse to ord er overfladisk identiske, men de adskiller sig på et dybere strukturelt niveau. EN lineal er en der styrer, ligesom en sanger er en der synger, så vi kan analysere disse ord som bestående af to meningsfulde enheder. I modsætning, lineal betyder "måleanordning" ikke kan nedbrydes yderligere.

Overlapningsniveau mellem "skurke" og "crux" vokalkategorier, afhængig af antallet af boligflytninger i det seneste årti. Data fra 143 talere fra det nordlige England.

Det viser sig, at de to betydninger af lineal er forbundet med en anden vokal for mange talere af sydbritisk engelsk, og forskellen mellem de to ord er steget i de senere år:den er større for yngre talere end for ældre talere. Så både skjult sproglig struktur og højttalerens alder kan påvirke den måde, vi udtaler visse vokaler på.

Slut aldrig i sigte

Dette illustrerer en anden vigtig egenskab ved sprogvariation:den bliver ved med at ændre sig. Sprogforskere skal derfor hele tiden revidere deres forståelse af variation, hvilket igen kræver, at man fortsat indhenter nye data, og opdatering af analysen. Måden vi gør dette på inden for lingvistik bliver revolutioneret af nye teknologier, fremskridt inden for instrumentel dataanalyse, og optageudstyrs allestedsnærværende (i 2018, 82 % af den voksne befolkning i Storbritannien ejede en optageenhed, ellers kendt som en smartphone).

Moderne sproglige projekter kan drage fordel af den teknologiske udvikling på forskellige måder. For eksempel, English Dialects App indsamler optagelser eksternt via smartphones, at opbygge et stort og konstant opdaterende korpus af moderne engelske accenter. Det korpus er kilden til opdagelsen vedrørende vokalen i crux på nordengelsk, for eksempel. At akkumulere information fra dette og mange andre projekter giver os mulighed for at spore variation med øget dækning, og at bygge stadig mere nøjagtige modeller, der forudsiger realiseringen af ​​individuelle lyde.

Kan denne nyligt raffinerede sproglige forståelse også forbedre talegenkendelsesteknologien? Måske, men for at forbedre, teknologien skal vide meget mere om dig.

Denne artikel er genudgivet fra The Conversation under en Creative Commons-licens. Læs den originale artikel.




Varme artikler