Videnskab
 science >> Videnskab >  >> Andet

Maskinoversættelse kunne gøre videnskab kun på engelsk tilgængelig for alle

Maskinlæring ved hjælp af kunstig intelligens har forbedret computeroversættelse i løbet af det sidste årti, men videnskabelige artikler, der anvender specialiseret jargon, er stadig en udfordring for maskinoversættelse. Ikke desto mindre bør videnskabsmænd prioritere at oversætte artikler til flere sprog for at give et retfærdigt landskab for spirende videnskabsmænd over hele verden, hævder UC Berkeley-forskere. Kredit:Valeria Ramírez-Castañeda, UC Berkeley

Mens han stadig gik i gymnasiet, arbejdede Xinyi Liu kort i et laboratorium på Beihang University i Beijing og blev overrasket over at se kinesiske forskere rutinemæssigt bruge Google Oversæt til at generere det første engelske udkast til videnskabelige artikler. Oversættelse er et must, hvis videnskabsmænd ønsker at underkaste sig højprofilerede tidsskrifter, som næsten alle er på engelsk.

"Det var normalt for postdocs bare at bruge Google Translate til først at oversætte alt og derefter til at ændre og polere det. Men efter den første oversættelse gav hele papiret ikke mening," sagde Liu, en voksende junior ved University of California , Berkeley, som er hovedfag i molekylær- og cellebiologi. "Bogstaveligt talt, alle ordene, alle begreberne blev sat sammen bare tilfældigt."

Der måtte være en bedre måde, tænkte hun.

Så sidste år, da hun så et nyt seminar blive undervist af Rebecca Tarvin om at bryde sprogbarrierer inden for videnskab, tilmeldte hun sig.

Denne klasse, som vil blive undervist på UC Berkeley for tredje gang i foråret 2023, var en prøveballon for Tarvin, en assisterende professor i integrativ biologi. Med fornyet interesse for mangfoldighed, lighed og inklusion på hele campus troede hun og arbejdsgrupper inden for hendes afdeling, at klassen kunne hjælpe UC Berkeley med at løse et langvarigt problem inden for videnskab:Engelsk, det dominerende videnskabssprog, er en stor hindring for videnskabsmænd, der ikke har engelsk som modersmål.

Det er ikke kun udenlandske studerende og videnskabsmænd, der er dårligere stillet, når naturvidenskab primært formidles på engelsk. Det samme er mange amerikanskfødte studerende. I efteråret 2020 var omkring 40 % af nybegyndere i UC Berkeley førstegenerations universitetsstuderende, og inden for 10-campus University of California-systemet voksede 39 % af førstegenerationsstuderende op med et andet sprog end engelsk som deres første sprog.

"Mange af vores studerende fra Californien voksede op med at oversætte for deres forældre," sagde Tarvin. "Oversættelse har været en del af deres liv, siden de var helt unge."

For Tarvin var klassen – Breaking Language Barriers in Evolution and Ecology – en "mulighed for både at lære eleverne færdigheder i oversættelseskompetencer og opmuntre eleverne til at være aktivister i dette område af strukturelle forandringer. Og faktisk har jeg set en virkelig positiv modtagelse af denne form for aktivisme fra de studerende, da de alle synes at være enige om, at det er virkelig vigtigt at tage fat på sprogbarrierer efter at have taget kurset."

Klassen førte Tarvin og nogle kandidatstuderende ved UC Berkeley til sammen med samarbejdspartnere i Canada, Israel og Ungarn til at skrive en videnskabelig artikel, der evaluerede nye maskinoversættelsesværktøjer, som kan bruges af mennesker verden over til at gøre deres videnskabelige artikler tilgængelige for ikke-engelsktalende . Avisen udkom online i denne måned i tidsskriftet BioScience . Oversættelser til spansk, fransk, portugisisk og ungarsk, medforfatternes sprog, er også online.

"Idéen her er, at vi forsøger at give folk værktøjerne og motivationen til at oversætte deres egen videnskabelige forskning," sagde Tarvin. "Videnskaben behøver ikke at være baseret på et enkelt sprog. Og der er masser af yderligere fordele, der kommer ved at inkorporere flersprogede tilgange i alle faser af videnskaben. For eksempel vil udgivelse på flere sprog gavne samfundet på grund af bedre videnskabskommunikation."

"Sproget kan være en barriere såvel som et fantastisk værktøj til at bringe mennesker sammen," understregede Emma Steigerwald, der er førsteforfatter på papiret og en UC Berkeley kandidatstuderende i miljøvidenskab, politik og ledelse. "Det er en barriere, som vi kan overvinde ved at bruge denne nye teknologi. Vi forklarer om teknologien, og hvordan den kan implementeres, og de ting, som vi skal være opmærksomme på, når vi bruger teknologien, og alle de vidunderlige og positive måder, videnskabskommunikation kan bruges til. kan transformeres ved at bringe denne nye teknologi ud i livet."

Mod et flersproget videnskabeligt netværk

Indtil for nylig var computeroversættelse en numse af vittigheder. Folk delte underholdende eksempler på fejloversættelser, som ofte syntes at nedgøre andre sprog end engelsk, og underforstået andre kulturer.

Men maskinlæring eller kunstig intelligens har dramatisk øget oversættelsesnøjagtigheden i det omfang, turister bruger internettjenester som Google Translate til at kommunikere med folk i de lande, de besøger.

Men for tekst, der indeholder masser af jargon – meget af det videnskabeligt, men også fra mange andre akademiske områder – er Google Oversæt sørgeligt utilstrækkeligt.

"Oversættelseskvaliteten er ikke for et tidsskrift," sagde Ixchel Gonzalez Ramirez, en af ​​de studerendes mentorer for kurset. "Mange gange skal folk betale for at få en professionel oversætter til at oversætte deres arbejde, og det er meget dyrt."

Det nye papir fremhæver nogle af de mange tjenester - de fleste af dem gratis - der kan konvertere engelsk videnskabelig skrift til andre sprog. Udover den velkendte Google Translate-platform omfatter disse DeepL, som bruger neurale netværk og hævder at være mange gange mere nøjagtige end konkurrenterne, når de oversætter engelsk til kinesisk, japansk, romanske sprog eller tysk og omvendt; Baidu Translate, en tjeneste fra det kinesiske internetfirma Baidu, der oprindeligt fokuserede på oversættelse mellem engelsk og kinesisk; Naver Pagago, en flersproget oversætter skabt af en virksomhed i Sydkorea; og Yandex.Translate, som bruger statistisk maskinoversættelse og fokuserer mest på russisk og engelsk.

"Oversættelse bliver mere og mere tilgængelig for enhver person. Uanset om du er ekspert eller ej, og uanset om du overhovedet er tosproget eller ej, er evnen til at oversætte bare så fremskyndet af så mange af de teknologier, vi har til rådighed i dag." sagde Steigerwald. "Og så hvordan kan vi integrere dette i vores arbejdsgang som videnskabsmænd, og hvordan ændrer dette de forventninger, der omgiver videnskabelig kommunikation?"

El aprendizaje automatizado que usa tecnologías de inteligencia kunstig ha mejorado la traducción en computador en la última década. Sin embargo, los artículos científicos que emplean terminologia especializada siguen siendo un reto para la traducción automática. Ingen obstant, la comunidad científica debería dar prioridad a la traducción de artículos en forskellige idiomas para ofrecer un panorama equitativo a los científicos y las científicas en formación de todo el mundo, afirman los investigadores de la UC Berkeley. Kredit:Valeria Ramírez-Castañeda, UC Berkeley

Engelsk er videnskabens lingua franca

Tarvins interesse for oversættelse opstod fra en af ​​hendes kandidatstuderende, Valeria Ramírez Castañeda, som i 2020 udgav et papir, der beskrev omkostningerne for hendes colombianske ph.d.-studerende, som ønskede at udgive eller interagere med kolleger i en verden domineret af engelsk.

Som en evolutionær biolog interesseret i, hvordan nogle dyr kom til at bruge gift, besluttede Tarvin at fokusere sit nye seminar på at oversætte artikler inden for evolution og økologi, selvom studerende, der tilmeldte sig, til sidst kortlagde deres egne kurser. Hun opsøgte især studerende som Liu og mentorer som Gonzalez Ramirez, der er to- eller flersprogede.

"Alle i klassen har haft en form for familierelateret forhold til sprog," sagde Tarvin.

Tarvin bad også Mairi-Louise McLaughlin, professor i fransk og lingvistik fra UC Berkeley og ekspert i journalistisk og litterær oversættelse, om at tale med klassen om, hvordan fagfolk griber oversættelse an, og hvordan oversættelse påvirker mening. Det emne gav genklang hos eleverne, da de forsøgte sig med at oversætte videnskabelige abstracts og nogle gange hele artikler.

Ruoming Cui, en voksende sophomore, som tog kurset i foråret 2022, valgte Baidu til at oversætte videnskabelige abstracts. Hun opdagede straks, at engelsks lange, komplekse sætninger og brug af flere ord til at beskrive et begreb virkede overflødige, når de blev gengivet til kinesisk.

"Vi plejer ikke at gøre det på kinesisk, fordi det vil gøre hver sætning ekstra lang, og det er meget kedeligt," sagde hun.

Liu tilføjede, at uden betydelig polering bliver mange engelske oversættelser forvanskede, sagde hun.

"Jeg hørte ordsproget, at selvom dit resultat er fantastisk, hvis du skriver et forvirrende papir på grund af oversættelsen, vil folk blive irriterede, fordi de ikke kan forstå, hvad du laver," sagde Liu. "Og det vil i høj grad påvirke, hvordan folk validerer forskningen, eller om de overhovedet vil læse den. Jeg tror, ​​det er en stor barriere i den videnskabelige verden."

Steigerwald, Tarvin og deres medforfattere indså også, at det gavner både engelsktalende og ikke-engelsktalende at skrive videnskabelige artikler på mere almindeligt engelsk – noget ikke-videnskabsmænd har opmuntret i lang tid.

"Hvis dit første sprog ikke er engelsk, og du bare prøver at læse den engelsksprogede version af avisen, vil det føles meget mindre tvetydigt og meget mere læsbart, når forfatteren har brugt almindeligt sprog," sagde Steigerwald. "Men også, meget vigtigt, når du går til at oversætte det stykke tekst, vil maskinlæringsværktøjerne have meget nemmere ved at oversætte noget, der er skrevet i almindeligt sprog. Så det her er en slags fremtidssikret din skrivning, så at hvis nogen vil oversætte det til en million sprog, vil de have meget nemmere ved det, når det er skrevet på den måde."

Der er stadig hindringer for udbredt oversættelse af videnskabelige artikler, herunder hvor de skal gøres tilgængelige, og hvordan man håndterer ophavsrettigheder. De fleste tidsskrifter accepterer ikke engang artikler, der ikke er på engelsk, og få tillader eksplicit samudgivelse af artikler med en oversættelse. Tarvin har fundet ud af, at få tidsskrifter har nogen politikker om oversættelser, og som et resultat af generelle copyright-begrænsninger opkræver mange udgivere ublu gebyrer for at lægge en oversættelse online efter udgivelsen.

"Det er temmelig forbløffende, hvor mange tidsskrifter, der ikke tillader dig frit at udgive oversættelser efter udgivelsen, og hvor få der har platformunderstøttelse, hvor du bare kunne have et abstrakt på et andet eller tredje sprog," sagde Tarvin. "Jeg tror, ​​at en stor barriere for dette er webplatformene; ikke kun udgivelses- og ophavsretsreglerne, men også platformens funktionalitet."

Med Breaking Barriers-seminaret og nu BioScience artikler, håber Tarvin og hendes kolleger gradvist at ændre normen inden for videnskab til standard at oversætte artikler til andre sprog, især sproget i det land, hvor forskningen blev udført, og medforfatternes sprog.

Og jo flere oversættelser derude, jo mere materiale er der til at træne maskinoversættelsessystemer til at gøre et bedre stykke arbejde, og gradvist øge kvaliteten af ​​videnskabelig oversættelse.

"I mit laboratorium oversætter vi meget af vores forskning, og nu gør folk i Emmas laboratorium det også," sagde hun. "Jeg tror, ​​at det at dele vores positive holdning til dette, og hvordan det kan gøre en forskel for mennesker, har påvirket en lille, men voksende gruppe mennesker, der begynder at inkorporere oversættelse i deres videnskabelige arbejdsgang."

Yderligere medforfattere til BioScience papiret omfatter ph.d.-studerende Valeria Ramírez-Castañeda og Débora Brandt fra UC Berkeley; András Báldi fra Institut for Økologi og Botanik ved Center for Økologisk Forskning i Vácrátót, Ungarn; postdoc Julie Teresa Shapiro fra Ben-Gurion University of the Negev i Be'er Sheva, Israel; og Lynne Bowker, professor i oversættelse og tolkning ved University of Ottawa i Canada. + Udforsk yderligere

Facebook afslører maskinlæringsoversætter til 100 sprog




Varme artikler