Eksempel på træningssæt camouflage. Kredit:Sen et al.
Forskere ved University of Wisconsin-Madison og Amherst College har for nylig introduceret en ny form for steganografi inden for maskinlæringsdomænet kaldet "træningssæt-camouflage". Deres rammer, skitseret i et papir, der er forududgivet på arXiv, giver en maskinlæringsagent mulighed for at skjule intentionen og målet med en opgave for en tredjepartsobservatør.
Steganografi er en krypteringsteknik, der beskytter eller skjuler data ved at indlejre meddelelser i andre meddelelser. I deres nylige undersøgelse, forskerne ved UW-Madison overvejede specifikt et scenarie, hvor en maskinlæringsagent (Alice), forsøger at træne en anden agent (Bob) i en hemmelig klassifikationsopgave, uden at en aflytning tredje agent (Eve) lærer om det.
"Forestil dig, at Alice har et træningssæt i en klassificeringsopgave for ulovlig maskinlæring, " skriver forskerne i deres papir. "Alice vil have Bob (et maskinlæringssystem) til at lære opgaven. Imidlertid, at sende enten træningssættet eller den trænede model til Bob kan vække mistanke, hvis kommunikationen overvåges."
I det scenarie, som forskerne forestiller sig, en tredje agent ved navn Eve påtager sig rollen som en dataverifikator, der overvåger kommunikationen mellem Alice og Bob. Da Eve bliver mistænksom over, hvad Alice sender Bob, hun kan afslutte kommunikationen mellem dem, nægter at levere de data, de udveksler. Eve fungerer som en auditor, der forsøger at finde ud af, om et træningsdatasæt er legitimt, før den videregives til eleven.
"At sende det private træningssæt ville afsløre Alices hensigt; at sende modelparametrene retning vil også vække mistanke, " forklarer forskerne i deres papir. "Alice skal camouflere kommunikationen, for at den ser hverdagsagtig ud for Eva, mens du undgår overdrevne kodetricks med Bob på forhånd."
Den steganografiske tilgang, som forskerne har udtænkt, giver Alice mulighed for at beregne et andet træningssæt på en helt anden og tilsyneladende godartet klassifikationsopgave, uden at vække Evas mistanke. Det gør det ved at finde et datasæt, der ser ud til at kunne anvendes til en bestemt opgave, mens det faktisk kan lære en agent at klare sig godt i en anden opgave. Ved at anvende sin standardindlæringsalgoritme på dette andet træningssæt, Bob kan tilnærmelsesvis gendanne klassificereren på den oprindelige opgave.
Den stenografiske tilgang, som forskerne havde udtænkt, var lidt af et lykketræf, som det kom ud af et ikke-relateret projekt inden for maskinlæring. Et system, som de udviklede, havde skabt en række undervisningssæt, hvoraf den ene indeholdt et forkert mærket punkt. Dette tilskyndede dem til at undersøge, om en agent kunne lære en anden agent at udføre en opgave, mens du camouflerer den med en anden opgave.
Forskerne udførte en række eksperimenter ved hjælp af rigtige klassifikationsopgaver og demonstrerede gennemførligheden af deres tilgang. Deres undersøgelse tyder på, at en masse information kan skjules blot ved at udnytte det faktum, at for enhver given opgave, der er flere modeller, der kan klare sig godt på den.
Nogle af de involverede forskere i undersøgelsen udfører nu yderligere undersøgelser inden for steganografi. andre, såsom Scott Alfeld, undersøger modstridende indstillinger, hvor en angriber forstyrrer træningstilfælde i et kontinuerligt rum, i stedet for at vælge en delmængde af eksempler, som i tilfældet med træningssæt-camouflage.
© 2019 Science X Network