Videnskab
 science >> Videnskab >  >> Elektronik

Én klasse på alle sprog

Fremskridt inden for kommunikationsteknologi har haft stor indflydelse i alle slags industrier, men måske ingen større end i uddannelse. Nu, alle fra hele verden kan lytte live til et nobelpristagerforedrag eller optjene kreditter fra de mest velrenommerede universiteter via internetadgang. Imidlertid, den mulige information, der kan opnås ved at se og lytte online, går tabt, hvis publikum ikke kan forstå underviserens sprog. For at løse dette problem, forskere ved Nara Institute of Science and Technology (NAIST), Japan, præsenterede en løsning med ny maskinlæring på det 240. møde i Special Interest Group of Natural Language Processing, Information Processing Society of Japan (IPSJ SIG-NL).

Maskinoversættelsessystemer har gjort det bemærkelsesværdigt enkelt at bede om vejvisning i et fremmed land. Sommetider, systemerne kan lave sjove og uskyldige fejl, men generelt set de opnår sammenhængende kommunikation, i det mindste ved korte udvekslinger kun en sætning eller to lange. I tilfælde af en præsentation, der kan strække sig over en time, såsom et akademisk foredrag, de er langt mindre robuste.

"NAIST har 20 procent udenlandske studerende og, mens antallet af engelskklasser udvides, mulighederne for disse elever er begrænset af deres japanske evner, "forklarer NAIST -professor Satoshi Nakamura, der ledede undersøgelsen.

Nakamuras forskningsgruppe erhvervede 46,5 timers arkiverede forelæsningsvideoer fra NAIST med deres transskriptioner og engelske oversættelser, og udviklede et dybt læringsbaseret system til at transskribere japansk foredragstale og efterfølgende oversætte det til engelsk. Mens du så videoerne, brugere ser undertekster på japansk og engelsk, der matcher forelæserens tale.

Man kunne forvente, at det ideelle output ville være samtidige oversættelser, der kunne udføres med levende præsentationer. Imidlertid, live oversættelser begrænser behandlingstiden og dermed nøjagtigheden. "Fordi vi lægger videoer med undertekster i arkiverne, vi fandt bedre oversættelser ved at oprette undertekster med en længere behandlingstid, " han siger.

De arkiverede optagelser, der blev brugt til evalueringen, bestod af forelæsninger fra robotik, tale behandling og software engineering. Interessant nok, ordfejlfrekvensen i talegenkendelse korrelerede med disfluency i undervisernes tale. En anden faktor fra de forskellige fejlfrekvenser var, hvor lang tid der talte uden pause. Det korpus, der blev brugt til uddannelsen, var stadig utilstrækkeligt og bør udvikles mere til yderligere forbedringer.

"Japan ønsker at øge sine internationale studerende, og NAIST har en stor mulighed for at være førende i dette forsøg. Vores projekt vil ikke kun forbedre maskinoversættelse, det vil også bringe klare tanker til landet, "fortsatte han.


Varme artikler