Videnskab
 science >> Videnskab >  >> Elektronik

Ny teknologi til maskinoversættelse nu tilgængelig

Kredit:CC0 Public Domain

En ny metode til forbedring af maskinoversættelse er blevet tilgængelig denne måned via Amsterdam Universitet. Projektet DatAptor, finansieret af NWO/STW, fremmer i stigende grad oversættelsesmaskiner ved at vælge datasæt.

Metoden bruges i applikationen Matching Data, tilbudt af TAUS, en vigtig tænketank inden for maskinoversættelse. Denne applikation løser en stor udfordring inden for digital oversættelse:for en god oversættelse er det nødvendigt at træne oversættelsesmaskinen med pålidelige kilder og datasæt, der indeholder den relevante type ord. For eksempel, oversættelse af en lovtekst kræver et helt andet ordforråd og en anden oversættelsestype end f.eks. en avisreportage.

Succesfuld implementering

I 2013 DatAptor -projektet, vejledt af professor Khalil Sima'an fra UvA Institute for Logic, Sprog og beregning, modtaget midler fra Teknologifonden STW (nu:NWO Domain Applied and Engineering Sciences) til at håndtere dette problem. Forskningsresultaterne fra DatAptor -projektet er nu blevet implementeret med succes af tænketanken TAUS. De tilbyder den nye teknologi under navnet Matching Data.

På TAUS's weblog siger Sima'an:"Vores drøm var at gøre selve world wide web til kilden til alle datavalg. Men vi besluttede at starte mere beskedent og gøre det meget store TAUS Data -depot til vores jagtmark først. I DatAptor vi lærte, at hvert domæne er en blanding af mange underdomæner. Kombinationen af ​​underdomæner i et meget stort depot rummer et væld af nye, uudnyttede valg. Derfor, hvis brugeren angiver et forespørgselskorpus, der repræsenterer deres interessedomæne, Matching Data-metoden vil sandsynligvis finde et passende valg i depotet."


Varme artikler