Repræsentation af de klynger, som forskerne har identificeret. Kredit:Gultchin et al.
Fremskridt inden for kunstig intelligens har muliggjort udviklingen af værktøjer, der kan forstå en række sprog og kommunikere med mennesker. Imidlertid, der er stadig aspekter af menneskelig kommunikation, som AI-systemer kæmper med, en af dem er humor.
Et team af forskere ved University of Oxford, Microsoft Research og TRASH har for nylig udført en undersøgelse, der undersøger humor i ordindlejringer. Ordindlejringer er et populært AI-værktøj, der kan forbinde ord med euklidiske vektorer.
"Vi var interesserede i at studere, hvordan computere kunne forstå humor, "Adam Kalai, Microsoft-forsker, der udførte undersøgelsen, fortalte TechXplore. "Mens AI er ret kraftfuld og endda kan oversætte fra et sprog til et andet, AI har ikke forstået humor. Vi besluttede at teste, om AI kunne forstå humor på niveau med et individuelt ord, da mange mennesker finder nogle ord som 'nincompoop' lidt sjove."
I deres undersøgelse, Kalai og hans kolleger overvejede seks hovedtræk ved ordhumor, henter inspiration fra eksisterende teorier og akademiske diskussioner om humor. Disse funktioner omfatter:humoristiske lyde (uanset betydning), sidestillinger/uventet uoverensstemmelse, seksuelle konnotationer, skatologiske konnotationer, krænkende ord og mundrette ord.
Forskerne undersøgte i hvor høj grad disse funktioner korrelerer med humor, og hvor godt en word2vec-indlejring er fortrænet på et korpus fra Google News, kaldet GNEWS, kunne fange hver af disse. Et datasæt brugt i deres undersøgelse var Engelthaler-Hill (EH) datasættet, som består af gennemsnitlige humorvurderinger for 4, 997 ord, som hver blev bedømt på en skala fra et til fem (af ca. 35 menneskelige bedømmere).
For bedre at forstå forskellene i folks opfattelse af sjove ord, forskerne samlede også et mindre originalt datasæt af meget humoristiske ord, rekruttering af engelsktalende mennesker til at mærke disse ord via Amazons Mechanical Turk-platform. De udførte en række humorvurderingsstudier, beder deltagerne om at vælge de ord, som de fandt mere humoristiske, samt at annotere ord med de relevante humorteorier for hver.
Figur, der beskriver forholdet mellem træk relateret til ordteorier i ordet indlejring og deres respektive humorvurderinger. Kredit:Gultchin et al.
"Vi bad flere personer om at vurdere, hvilke ord de fandt de mest humoristiske blandt engelske ord, " Kalai forklarede. "Vi designede en undersøgelse, hvor folk identificerede de ord, de fandt sjovest med minimal indsats (de færreste klik)."
Efterfølgende forskerne undersøgte, hvordan de funktioner ved humor, som de oprindeligt havde identificeret, korrelerede med humorvurderingerne i deres datasæt, at bestemme effektiviteten af teoretiske konstruktioner til at fange vurderinger givet af mennesker. Ud over, de testede forudsigeligheden af disse vurderinger ved hjælp af ordindlejringer, udforske, i hvilket omfang AI kunne forstå humor.
"Vi fandt ud af, at AI kunne forstå, hvorfor folk fandt nogle ord sjovere end andre, og AI kunne endda forstå forskellene mellem sanser for humor, " sagde Kalai. "AI forstår stadig ikke humor i sætninger eller længere tekster, men vi håber, at vores arbejde er et udgangspunkt."
Kalai og hans kolleger fandt ud af, at ordindlejringer effektivt fangede aspekter af ordhumor som vurderet på EH-datasættet, samt forskelle i humorvurderinger fra deres nye datasæt. Deres resultater tyder endvidere på, at folks sans for humor kunne indlejres ved hjælp af en håndfuld vurderinger, og at de resulterende indlejringer kunne bruges til at forudsige humorvurderinger for tidligere uklassificerede ord.
"Vores konklusioner viser en interessant anvendelse af ordindlejringer og baner vejen for at udnytte dem til at udføre mere AI-humorarbejde, såsom at generere eller forudsige humoristiske ord, der matcher individuelle sanser for humor, og samlet set, "Limor Gultchin, en forsker ved University of Oxford involveret i undersøgelsen, fortalte TechXplore. "På samme tid, vi giver også yderligere validering til intuitive forestillinger om humor, og viden indsamlet på andre områder, såsom psykologi eller filosofi."
Undersøgelsen udført af Kalai, Gultchin og deres kolleger viser, at ordindlejringer kan forbedre vores forståelse af humor på en række forskellige måder. For det første, de fandt, at etablerede teorier om humor (f.eks. overlegenhedsteorien, uoverensstemmelsesteori, osv.) er repræsenteret i ordindlejringer i varierende grad og kan således bruges til at identificere eller forudsige humor, fanget af menneskelige vurderinger.
Tabel, der fanger forskellene mellem en mere 'kvindelig' sans for humor og 'mandlig'. Kredit:Gultchin et al.
Brug af vektorrepræsentationer af ord, forskerne var også i stand til at definere en individuel sans for humor som en gennemsnitlig vektor, bruge disse vektorer til at forudsige forskellige menneskers sanser for humor (dvs. de humorvurderinger, de ville give til bestemte ord). Endelig, gruppering af humoristisk sans tillod dem at identificere klynger af humor, såsom 'kvindelig humor, '' mandlig humor, ''ældre humor, ' etc.
Dette er et vigtigt fund, da det validerer ideen om, at forskellige grupper af mennesker har forskellige sanser for humor. For eksempel, de bemærkede, at seksuelle ord (f.eks. 'valmue') var sjovere for mænd end for kvinder, mens kvinder reagerede mere på 'sjovt-klingende' ord (f.eks. 'gobbledegook').
"I en alder af udbredte AI-systemer, såsom anbefalingssystemer eller automatiserede assistenter, humor ville sandsynligvis vise sig at være vigtig for at lette en glattere, mere problemfri interaktion mellem brugere og automatiserede systemer, " sagde Gultchin. "Vi håber, at dette arbejde vil hjælpe som et proof of concept, der viser, at eksisterende NLP-værktøjer allerede kan hjælpe os med at nå dette mål."
Kalain, Gultchin og deres kolleger vil gøre de nye datasæt brugt i deres undersøgelse offentligt tilgængelige, så andre forskere kan bruge dem i deres undersøgelser. De føler, at en forbedring af AI-systemers forståelse af ordhumor kunne åbne op for flere interessante muligheder, f.eks. fører til udvikling af værktøjer til at hjælpe komikere eller forbedre interaktioner mellem maskiner og mennesker.
"Vi er stadig i gang med at se, hvordan dette arbejde vil blive accepteret, men der findes flere fremtidige retninger, " sagde Gultchin. "Det ville være virkelig interessant at se, om de begreber, der er lagt her, virkelig kunne bruges i et interaktivt system, som producerer 'sjove' modifikationer af sætninger baseret på en persons sans for humor, som repræsenteret ved hjælp af ordindlejringer. En anden interessant retning er at se, om vi med tiden kan lære at forudsige og generere fulde humoristiske sætninger eller, med den seneste udvikling, fulde humoristiske afsnit."
© 2019 Science X Network