Videnskab
 science >> Videnskab >  >> Elektronik

Alexa, hvordan udvikler ordsanser sig?

Kredit:CC0 Public Domain

Beviser tyder på, at grænsefladen mellem mennesker og teknologi kun bliver mere central for det moderne liv.

For at mennesker skal kunne udtrække meningsfuld information fra skare af data, der indsamles af de "smarte" maskiner, som vi interagerer med - f.eks. Mobiltelefoner - har computere brug for at kunne behandle sprog som mennesker. Grenen af ​​kunstig intelligens, der imødekommer dette behov, kaldes behandling af naturligt sprog.

Et papir kaldet "Algoritmer i den historiske fremkomst af ordfornemmelser" - som vises online i dag i Procedurer fra National Academy of Sciences ( PNAS ) - er den første til at se på 1, 000 års engelsk udvikling og opdage den slags algoritmer, som menneskelige sind har brugt til at udvide eksisterende ord til nye betydninger. Denne form for "reverse engineering" af, hvordan menneskeligt sprog har udviklet sig, kan have konsekvenser for bearbejdning af naturligt sprog med maskiner.

"For at kommunikere med mennesker med succes, computere skal være i stand til at bruge ord fleksibelt, men efter de samme principper, der guider menneskets sprogbrug, "forklarer Barbara Malt, Direktør for Cognitive Science Program ved Lehigh University og en af ​​projektets samarbejdspartnere.

Ifølge Malt, ord akkumulerer familier med beslægtede sanser i løbet af historien. For eksempel, ordet 'ansigt' betød oprindeligt den forreste del af et hoved, men med tiden kom det også til at betyde den forreste del af andre genstande, såsom klintens 'ansigt', og en følelsesmæssig tilstand, såsom at iføre sig et modigt 'ansigt'.

"Dette arbejde, "siger Malt, "var rettet mod at undersøge de kognitive processer, der skaber disse sansefamilier."

Teamet - herunder hovedforsker Yang Xu, en computing lingvist fra University of Toronto og Mahesh Srinivasan, adjunkt i psykologi ved University of California Berkeley, sammen med Berkeley-studerende Christian Ramiro-identificerede en algoritme kaldet "nærmeste nabokæde" som den mekanisme, der bedst beskriver, hvordan ordsanser akkumuleres over tid.

I "kæder til nærmeste nabo" analyseres inputpunkter som et hierarki af klynger. Forskernes model fangede den kædeproces, der opstår, da nye ideer blev udtrykt ved hjælp af ordet med den mest nært beslægtede eksisterende forstand. Denne kædemodel passede bedre til det historiske mønster for fornuftens fremkomst end alternative modeller.

"Det er et åbent spørgsmål, hvordan de algoritmer, vi undersøgte her, kan anvendes direkte til at forbedre maskinforståelse for nyt sprogbrug, "siger Xu.

Efter at have udviklet de beregningsalgoritmer, der forudsagde den historiske rækkefølge, hvor sanserne for et ord er opstået, holdet testede disse forudsigelser mod optegnelser over engelsk i løbet af det sidste årtusinde ved hjælp af den engelske historiske tesaurus, en stor database, hvor hvert af et ords mange sanser er markeret for dets dato for fremkomsten i sproget.

Deres fund tyder på, at ordsanser opstår på måder, der minimerer kognitive omkostninger, som er de samlede omkostninger ved at generere, fortolke og lære ordsanser. Med andre ord, nye ordsanser opstår gennem en effektiv mekanisme, der udtrykker nye ideer via et kompakt sæt ord.

"Når nye ideer er kodet på engelsk, de er mere tilbøjelige til at blive kodet ved at udvide betydningen af ​​et eksisterende ord end ved oprettelse af et nyt ord, "siger Malt." En populær idé kan være, at når du har en ny idé, skal du finde på et nyt ord for det, men vi fandt ud af, at denne strategi faktisk er mindre almindelig. "

Sidste år, det samme team var det første til at identificere et sæt principper for et andet aspekt af sprogudviklingen:metaforisk kortlægning.

I løbet af det sidste årtusinde, ordsanser har stort set udviklet sig fra bogstavelige domæner til metaforiske domæner - kaldet metaforisk kortlægning. Ord, der oprindeligt kun havde konkret eller ekstern betydning (som at 'gribe' et fysisk objekt), er vokset til at have betydning i det abstrakte og indre (som ved at 'gribe' en idé). Gruppen var den første til at vise, at denne progression har fulgt et kompakt sæt psykologiske og kognitive principper, og at bevægelsen på tværs af riger kan forudsiges.

Gruppens fund blev offentliggjort i Cognitive Psychology i en artikel med titlen "Evolution of word meanings through metaforical mapping:Systematicity over the past millennium."

"Sammen, vores undersøgelser begynder at vise, at måderne, hvorpå ord har udviklet nye betydninger, ikke er vilkårlige, men i stedet afspejler grundlæggende egenskaber ved, hvordan vi tænker og kommunikerer med hinanden, "forklarer Mahesh Srinivasan, Assistant Professor of Psychology and director of the Language and Cognitive Development laboratory at UC Berkeley