Videnskab
 science >> Videnskab >  >> Elektronik

AQM+:En ny model til generering af visuel dialogspørgsmål

Kredit:Lee et al.

Forskere hos Clova AI Research, NAVER og LINE, har for nylig foreslået en ny ramme kaldet AQM+, der gør det muligt for dialogsystemer at generere kontekstrelevante spørgsmål og svar. Deres model, skitseret i et papir, der er forududgivet på arXiv, vil blive præsenteret på den 7. internationale konference om læringsrepræsentation (ICLR 2019), i New Orleans.

"Intra-maskine og menneske-maskine samarbejde er blevet betragtet som et væsentligt og meningsfuldt forskningsemne, i særdeleshed, fra etik og offentlig interesse for kunstig intelligens, "Sang-Woo Lee, en af ​​de forskere, der har udført undersøgelsen, fortalte TechXplore. "Med fokus på opgaveorienteret dialog (TOD), forskere har fået betydelig indsigt fra GO-spil mellem mennesker og AlphaGo. Mere specifikt, disse forskere mener, at målorienterede dialogmodeller kan forbedres ved at træne modeller i maskine-maskine-interaktioner i gigantisk skala, som gør det muligt for AlphaGo at slå menneskelige eksperter. Imidlertid, Jeg er ikke helt enig i denne idé, fordi dialog er en opgave baseret på samarbejde mellem to spillere og er fundamentalt forskellig fra Go, som er et konkurrencespil."

Ifølge Lee, opgaveorienteret dialog (TOD) ligner spillet 20 spørgsmål, da dialogsystemets mål bør være at indsnævre en brugers hensigter og anmodninger. I en tidligere undersøgelse, Lee og hans kolleger introducerede en ramme for opgaveorienterede dialogsystemer kaldet "svareren i spørgers sind" (AQM), der er baseret på denne idé. AQM tillader dialogsystemer at stille spørgsmål, der maksimerer deres informationsgevinst, reducere usikkerheden om brugerens hensigt.

Kredit:Lee et al.

I modsætning til andre tilgange, AQM beregner eksplicit den posteriore fordeling og finder løsninger analytisk. På trods af de mange fordele, AQM viste sig at generalisere dårligt i opgaver i den virkelige verden, hvor antallet af genstande, spørgsmål og svar er typisk ubegrænsede.

I deres nylige undersøgelse, forskerne adresserede denne begrænsning og foreslog en ny tilgang, AQM+. I modsætning til deres tidligere tilgang, AQM+ kan anvendes til store problemer, generere spørgsmål og svar, der er mere sammenhængende med den skiftende kontekst i en given dialog.

"I lighed med menneskelig dialog, vores AQM+ modellerer, hvad modstanderen siger og begrunder den mest effektive strategi for at forstå modstanderens sind og hensigt, ved hjælp af en informationsteori-metrik (informationsgevinst), " Lee forklarede. "Denne tilgang er forskellig fra tidligere neurale netværk-baserede metoder til TOD, som hovedsageligt brugte sekvens-til-sekvens (Seq2Seq) til direkte at generere spørgsmål ved at svare på den tidligere ytring."

Kredit:Lee et al.

Lee og hans kolleger evaluerede AQM+ på et udfordrende opgaveorienteret visuel dialogproblem kaldet GuessWhich. Deres model opnåede bemærkelsesværdige resultater, udkonkurrerende state-of-the-art tilgange med en betydelig margin.

"Tilgangen baseret på vores 20 spørgsmål-spil i AQM+ til spørgende brugere kan tackle komplekse dialogsituationer, hvor der findes mange og forskellige svar og sager relateret til generelle spørgsmål, samt ja eller nej spørgsmål, " sagde Lee. "Dette betyder, at vores AQM+ kan anvendes til forskellige TOD-situationer i den virkelige verden."

I deres tests, Lee og hans kolleger Jung-Woo Ha, Tong Gao, Sohee Yang og Jaejun Yoo fandt ud af, at AQM+ reducerede fejl med 60 procent, mens en dialog skrider frem, mens eksisterende algoritmer opnåede en fejlreduktion på mindre end 6 procent. Ifølge forskerne, AQM+ kunne bruges til at generere både åbne og lukkede spørgsmål.

Kredit:Lee et al.

"Det er fortsat meget udfordrende at træne modeller fra dialogdata på en ende-til-ende måde, især til udvikling af TOD-systemer, "Jung-Woo Ha, en anden forsker involveret i undersøgelsen, fortalte TechXplore. "Selvom AQM+ hovedsageligt fokuserer på spørgsmål for at få nyttig information fra besvareren, det kan naturligt udvides ved at inkludere besvarelse af spørgsmålene ud fra samme tilgang."

Lee, Ha og deres kolleger overvejer nu en række retninger for fremtidig forskning. For det første, de vil gerne udvikle deres tilgang yderligere for at opnå en generel læringsramme for dialog. Deres ultimative mål er at designe et system, der kan opnå menneskelignende nøjagtighed i kommunikation med mennesker.

"Ultimativt, vi sigter mod at udvikle en generel AI-ramme, der muliggør menneskelignende maskine-maskine og maskine-menneske dialoger, "Ha sagde. "Som industriforskere, vi vil anvende vores teknologier til forskellige tjenester såsom messenger og AI assistent platform, giver dermed større værdi for globale brugere."

© 2019 Science X Network