Dalí-planeten. Kredit:Dalí-museet
En gæst på Dalí-museet i Skt. Petersborg, Florida trykker på en dørklokke ved siden af en mørk skærm i naturlig størrelse. En mørklagt skikkelse iført et lækkert jakkesæt og med blyantoverskæg forlader langsomt sit staffeli og kommer hen mod hende i lyset.
Det er, selvfølgelig, Salvador Dalí, der ser på den besøgende og fortæller om sin kunst og sit museum. Når den besøgende er ved at gå, han dukker op igen. Han spørger, om hun vil have et billede, slår derefter sin mobiltelefon frem og tager en selfie med hende.
Det fascinerende ved dette møde er, at det faktisk er Dalí selv. Hvordan er det muligt, at den store spanske surrealist kan interagere med medlemmer af offentligheden år efter sin død, selv bruge en telefon, der ikke eksisterede, da han levede? Velkommen til en verden af deepfakes, en foruroligende teknologi med et stort potentiale til at bedrage – og også nogle uventede positive anvendelser.
Deepfakes er en kraftfuld ny teknik til at skabe realistisk, men alligevel falsk video- eller lydindhold. At puste liv i Dalí, museet brugte dyb læring til at sætte en computer i stand til problemfrit at udveksle ansigtet på en levende skuespiller, der klædte sig og opførte sig som Dalí, med et digitalt genereret billede af kunstnerens ansigt og udtryk.
Dette involverer en "træningsproces", hvor avancerede maskinlæringsalgoritmer gennemgår optagelser af Dalí og skuespilleren for at lære at generere nye ægte ansigtsbilleder af begge mænd. Den lærer også at tage et eksisterende billede af den ene mand og generere et billede af den anden, der passer perfekt til den førstes ansigtsudtryk og hovedstilling.
Dette gør det muligt at generere Dalí-ansigter, der matcher skuespillerens bevægelser, som derefter automatisk indsættes i den nye video - hvilket skaber en illusion af Dalí selv. Der er flere detaljer her for dem, der er interesserede.
Muligheden banker på
Til dato, de fleste producenter af deepfakes har udnyttet den mørke side af teknologien. Dette har varieret fra satire, såsom dette aprilsnar-klip, der viser Mark Zuckerberg, der annoncerer, at han sletter Facebook; til ry-skadelige optagelser af Hollywood-stjerner, der angiveligt medvirker i pornofilm; til bedrageri, såsom at efterligne en administrerende direktørs stemme for at anmode om overførsel af en stor sum penge.
Risiciene fra deepfakes er ubestridelige. Alligevel illustrerer Dalí-eksemplet, at det er umuligt at være sort/hvid om denne teknologi. I vores forskning, vi grupperer deepfakes i fem kategorier:stemmebytning, tekst til tale, video ansigtsbytte, helkropsdukketeater og læbesynkronisering. I hver kategori, vi ser klare forretningsmuligheder. Nogle mangler stadig at materialisere sig, mens andre allerede er ved at blive realiseret.
1. Buktale 2.0
Stemmebytning kan ændre en persons stemme eller få den til at efterligne en andens. Det kan manipuleres til at lyde yngre eller ældre, mand eller kvinde, og med forskellige dialekter eller accenter. Mulige anvendelser inkluderer en lydbogfortæller, der taler med forskellige karakterers stemmer, eller at bruge en berømt person som fortæller, uden at de skal besvære sig med at læse hele historien op.
Det åbner også fascinerende muligheder for virtuelle assistenter som Siri. I stedet for at skulle optage stemmeskuespillere med forskellige accenter og køn, lyd-stemmebytning gør det muligt at gøre dette med kun én stemme – er der nogen, der føler, at en blockbuster-app er på vej?
2. At give stemmer tilbage
Det har i mange år været muligt at få en computer til at tale ved at skrive tekst ind i en applikation. Nu eksisterer den deepfake-teknologi til at gøre dette med en bestemt persons stemme, selv hvor de ikke tidligere har optaget de pågældende ord. Dette er ved at blive en livsændrende teknologi for mennesker, der har mistet evnen til at tale forståeligt, såsom dem, der har haft slagtilfælde eller har en fremadskridende sygdom såsom amyotrofisk lateral sklerose - se klippet nedenfor.
Andre mulige anvendelser af denne lyd-tekst-til-tale-teknologi omfatter korrektion af forkert talte ord i en voiceover i stedet for at skulle få personen til at optage det igen.
3. "Snakker du til mig?"
Som vi så med Dalí-eksemplet, videoansigtsbytte kan erstatte én persons ansigt i en video med en andens ansigt. Dette har et stort potentiale i filmene.
For eksempel, en professionel deepfake kunstner har demonstreret, hvordan lignende teknikker til Dalí-museet kunne have været brugt til at afælde Robert De Niro i The Irishman, snarere end den dyre og tidskrævende CGI, der hjalp med at få filmens samlede produktionsomkostninger op på 175 millioner USD (135 millioner GBP). Klippet nedenfor viser, hvordan deepfake-teknologi kan opnå lignende kvalitet. En anden mulig anvendelse af denne teknologi er mere naturtro stuntdobler.
4. Spil på
Video dukketeater i hele kroppen kan transponere bevægelse fra en persons krop til en andens. Mulige anvendelser inkluderer mere fordybende videospil, hvor spillere kan indsætte sig selv i handlingen, med deres egne gang- og bevægelsesegenskaber; og film, hvor ikke-dansende skuespillere tilsyneladende kan danse ved hjælp af optagelser af professionelle dansere.
5. Undertekster RIP
Lyd- og videolæbesynkronisering kan ændre mundbevægelser og talte ord i en video. Det vil snart være muligt at gøre omkostningseffektive, oversættelser af film af høj kvalitet, TV-shows og andre videoer. En trænet algoritme ville efterligne den originale skuespillers stemme, men på et andet sprog, med læbebevægelsen i sync med de nye ord.
Så selvom det er klart, at deepfakes kan og bliver brugt skadeligt, den samme dybe indlæringsteknologi åbner også for mange innovative forretningsapplikationer. Mange kreative og produktive muligheder bliver tydelige – og uden tvivl mange andre, som folk ikke engang har set endnu.
Denne artikel er genudgivet fra The Conversation under en Creative Commons-licens. Læs den originale artikel.