Den eksperimentelle opsætning, når forsøgspersonen (til venstre) taler med ERICA (til højre) Kredit:Kyoto University / Kawahara lab
Vi har alle prøvet at tale med enheder, og i nogle tilfælde taler de tilbage. Men, det er langt fra at have en samtale med en rigtig person. Nu, et forskerhold fra Kyoto Universitet, Osaka Universitet, og Advanced Telecommunications Research Institute, eller ATR, har betydeligt opgraderet interaktionssystemet til samtaleandroid ERICA, giver hende endnu større dialogfærdigheder.
ERICA er en android skabt af Hiroshi Ishiguro fra Osaka University og ATR, specielt designet til naturlig samtale gennem inkorporering af menneskelignende ansigtsudtryk og gestus. Forskerholdet demonstrerede opdateringerne under et symposium på National Museum of Emerging Science i Tokyo.
"Når vi taler med hinanden, det er aldrig en simpel frem og tilbage progression af information, " siger Tatsuya Kawahara fra Kyoto University's Graduate School of Informatics, og en ekspert i tale- og lydbehandling. "Lytning er aktiv. Vi udtrykker enighed ved at nikke eller sige 'uh-huh' for at opretholde samtalens momentum. Dette kaldes 'backchanneling, ' og er noget, vi ønskede at implementere med ERICA."
Holdet fokuserede også på at udvikle et system til "opmærksom lytning." Det er når en lytter stiller uddybende spørgsmål, eller gentager det sidste ord i talerens sætning, giver mulighed for mere engagerende dialog. Indsættelse af en række afstandssensorer, ansigtsgenkendelseskameraer og mikrofonsystemer, holdet begyndte at indsamle data om parametre, der er nødvendige for en flydende dialog mellem ERICA og et menneske.
"Vi kiggede på tre kvaliteter, når vi studerede backchanneling, "fortsætter Kawahara." Disse var:timing - når der sker et svar; leksikalsk form - hvad der bliver sagt; og prosodi, eller hvordan reaktionen sker."
Svar blev genereret gennem maskinlæring ved hjælp af et rådgivningsdialogkorpus, resulterer i dramatisk forbedret dialoginddragelse. Test i fem minutters sessioner med et menneske, ERICA demonstrerede betydeligt mere dynamiske talefærdigheder, herunder brug af backchanneling, delvise gentagelser, og erklæringsvurderinger.
"At lave en menneskelignende samtalerobot er en stor udfordring, " siger Kawahara. "Dette projekt afslører, hvor meget kompleksitet der er i at lytte, som vi måske betragter som hverdagsagtige. Vi nærmer os en dag, hvor en robot kan bestå en Total Turing-test."