Højttalertilpasning og højttalerkodningstilgange til træning, kloning og lydgenerering. Kredit:arXiv:1802.06006 [cs.CL]
Via whitepaper, som de har uploadet til arXiv preprint server, et team hos Baidu (Kinas svar på Google) har annonceret en opgradering til deres tekst-til-tale-applikation kaldet Deep Voice. Nu, i stedet for at tage en halv time eller længere tid på at analysere en persons stemme og replikere den, systemet kan gøre det på mindre end et minut. Det neurale netværksbaserede system er en del af en indsats fra teamet hos Baidu for at få maskiner til at lyde mere som mennesker, når de "taler" til os.
Der er to dele af systemet. Den første involverer optagelse af stemmeprøver for at give systemet mulighed for at lære, hvordan emnets stemme lyder. Anden del læser brugerdefineret tekst højt med emnets stemme.
Flere grupper har arbejdet på projekter, der har til formål at gengive lyden af en individuel persons stemme, tilsyneladende for at tillade robotassistenter at lyde som egentlige menneskelige assistenter. Dermed, et program, der konverterer tekst til ord, der lyder som dig, din nabo, Donald Trump eller dronningen af England forventes ikke at tilbyde meget i vejen for et slutprodukt - selvom Baidu foreslår, at det kunne bruges af folk, der har mistet brugen af deres stemme. I stedet, det er ment som et springbræt til større ting. Det nye system, holdet rapporterer, fungerer optimalt, når der gives 100 fem-sekunders stemmeprøver. Det kan også manipulere en stemme, giver folk mulighed for at høre, hvordan de kan lyde, for eksempel, med britisk accent, eller som en af det modsatte køn. Det bliver også bedre til at efterligne stemmer, og er nu i stand til at narre stemmegenkendelsessoftware 95 procent af tiden - og en menneskelig test gav systemet en gennemsnitlig vurdering på 3,16 ud af 4.
Men, som mange i pressen har bemærket, teknologien kan give problemer. Optagede afhøringer af politiet kan blive ubrugelige, hvis nogen med en smartphone kunne generere den samme samtale. Der er også problemet med identitetstyveri. Hvis en tyv kan stjæle dine data og din stemme, du får det måske aldrig tilbage. Eller overvej at politiske agenter udgiver falske optagelser af politikere, der har samtaler, der kan påvirke et valg.
© 2018 Tech Xplore