Videnskab
 science >> Videnskab >  >> Elektronik

Kunstig intelligens skinner lys på det mørke net

For at matche brugere fra forskellige fora, som sandsynligvis er den samme person, en algoritme beregner ligheder i profiler, såsom deres brugernavne; i indhold, såsom lignende fraseringer; og i deres netværk, såsom det samfund, de interagerer med. Kredit:Massachusetts Institute of Technology

Under overfladebanen, den offentlige form af internettet, du bruger dagligt til at tjekke e-mail eller læse nyhedsartikler, eksisterer et skjult "mørkt web". Vært for anonyme, adgangskodebeskyttede websteder, det mørke web er, hvor kriminelle markedspladser trives med reklame og salg af våben, stoffer, og handlede personer. Retshåndhævende myndigheder arbejder kontinuerligt på at stoppe disse aktiviteter, men de udfordringer, de står over for med at efterforske og retsforfølge de virkelige mennesker bag de brugere, der poster på disse websteder, er enorme.

"Pop-up-karakteren af ​​dark-web markedspladser gør det ekstremt vanskeligt at spore deres deltagere og deres aktiviteter, " siger Charlie Dagli, en forsker i MIT Lincoln Laboratory's Artificial Intelligence Technology and Systems Group. Dagli henviser til den hurtige hastighed, hvormed dark-web-markeder lukker ned (fordi de er hacket, overfaldet, forladt, eller oprettet som et "exit-svindel", hvor webstedet lukker ned med vilje, efter at kunder har betalt for ikke-opfyldte ordrer), og nye dukker op. Disse markeders korte levetid, fra et par måneder til et par år, hindrer indsatsen for at identificere deres brugere.

For at overkomme denne udfordring, Lincoln Laboratory udvikler nye softwareværktøjer til at analysere overflade- og mørkewebdata.

Disse værktøjer udnytter den ene fordel, som dette muldvarp-lignende problem giver – de forbindelser, sælgere og købere opretholder på tværs af flere lag af nettet, fra overflade til mørk, og på tværs af dark-web-fora. "Denne konstante skift mellem websteder er nu en etableret del af, hvordan dark-web markedspladser fungerer, siger Dagli.

Brugere laver konstant nye profiler. Selvom de måske ikke bruger de samme brugernavne fra websted til websted, de holder deres forbindelser i live ved at signalere til hinanden gennem deres indhold. Disse signaler kan bruges til at forbinde personas, der tilhører den samme bruger på tværs af dark-web fora og, mere afslørende, at forbinde personas på det mørke web til overfladenettet for at afdække en brugers sande identitet.

At forbinde brugere på det mørke web er, hvad retshåndhævelsen allerede forsøger at gøre. Problemet er, at mængden af ​​data, de skal bruge for manuelt at blande sig igennem—500, 000 telefonnumre og 2 millioner sexannoncer, der sendes om måneden – er for stort og ustruktureret til, at de hurtigt kan finde forbindelser. Dermed, kun en lav procentdel af sagerne kan forfølges.

For at automatisere person-linking-processen, Lincoln Laboratory træner maskinlæringsalgoritmer til at beregne ligheden mellem brugere på forskellige fora. Beregningerne er baseret på tre aspekter af brugernes kommunikation online:"Hvordan de identificerer sig over for andre, hvad de skriver om, og hvem de skriver til, " forklarer Dagli.

Algoritmen tilføres først data fra brugere på et givet Forum A og opretter en forfatterskabsmodel for hver bruger. Derefter, data fra brugere på Forum B køres mod alle brugermodeller fra Forum A. For at finde matches til profiloplysninger, algoritmen leder efter ligetil ledetråde, såsom ændringer i brugernavnets stavemåde som "sergeygork" på Forum A til "sergey gorkin" på Forum B, eller mere subtile ligheder som "joe knight" til "joe mareridt."

Den næste funktion systemet ser på er indholdslighed. Systemet opfanger unikke sætninger – f.eks. "sjov i solen" - der bruges i flere annoncer. "Der foregår en masse copy-and-paste, så lignende sætninger dukker op, som sandsynligvis kommer fra den samme bruger, " siger Dagli. Systemet leder derefter efter ligheder i en brugers netværk, som er den kreds af mennesker, som brugeren interagerer med, og de emner, som brugerens netværk diskuterer.

Profilen, indhold, og netværksfunktioner smeltes derefter sammen for at give et enkelt output:en sandsynlighedsscore for, at to personas fra to fora repræsenterer den samme virkelige person.

Forskerne har testet disse persona-linking-algoritmer både med open source Twitter- og Instagram-data og håndmærkede jordsandhedsdata fra dark-web-fora. Alle de data, der bruges i dette arbejde, er opnået gennem autoriserede midler. Resultaterne er lovende. "Hver gang vi melder en kamp, vi har ret 95 procent af tiden. Systemet er et af de bedste linksystemer, vi kan finde i litteraturen, siger Dagli.

Dette arbejde er den seneste udvikling inden for igangværende forskning. Fra 2014 til 2017, Lincoln Laboratory bidrog til Defense Advanced Research Projects Agency (DARPA) Memex-program. Memex resulterede i en suite af overflade- og dark-web dataanalysesoftware udviklet i samarbejde med snesevis af universiteter, nationale laboratorier, og virksomheder. Ti laboratorieteknologier, der spænder over tekst, tale, og visuelle analyser, der blev skabt til Memex, blev frigivet som open source-software via DARPA Open Catalog.

I dag, mere end 30 bureauer verden over bruger Memex-software til at udføre undersøgelser. En af de største brugere, og en interessent i Memex's udvikling, er Human Trafficking Response Unit (HTRU) i Manhattan District Attorney's Office.

Manhattan District Attorney Cyrus Vance Jr. udtalte i et skriftligt vidneudsagn til det amerikanske Repræsentanternes Hus, at hans kontor brugte Memex-værktøjer til at screene mere end 6, 000 anholdelser for tegn på menneskehandel alene i 2017. "Vi brugte også Memex i 271 undersøgelser af menneskehandel og i seks nye anklager om sexhandel, der blev rejst i 2017, " sagde han. Med introduktionen af ​​Memex, anholdelser af prostitution, der blev screenet af HTRU for indikatorer for menneskehandel, steg fra 5 til 62 procent, og efterforskning af prostitutionsrelaterede anholdelser i New York Police Department steg fra 15 til 300 om året.

Jennifer Dolle, vicechefen for HTRU, besøgte laboratoriet for at præsentere, hvordan enheden har haft gavn af disse teknologier. "Vi bruger disse værktøjer hver eneste dag. De har virkelig ændret, hvordan vi driver forretning på vores kontor, " siger Dolle, forklarer, at før Memex, en efterforskning af menneskehandel kan tage betydeligt længere tid.

Nu, Memex-værktøjer gør det muligt for HTRU hurtigt at forbedre nye sager og opbygge undersøgelser af sexhandel ud fra kundeemner, der har lidt information. For eksempel, disse værktøjer – inklusive et kaldet TellFinder (bygget af Memex-bidragyderen Uncharted Software) til indeksering, opsummering, og søgning efter sexannoncedata – er blevet brugt til at identificere yderligere, mindreårige ofre fra data i en enkelt onlineprostitutionsannonce. "Disse yderligere efterforskningsspor gør det muligt for HTRU at retsforfølge menneskehandlere på anklager om voldelige forbrydelser og holde disse tiltalte ansvarlige for den sande natur af de forbrydelser, de begår mod sårbare ofre, siger Dolle.

Forskere fortsætter med at lære, hvordan nye teknologier kan skræddersyes til, hvad bureauer har brug for, og til hvordan det mørke web fungerer. "Datadrevet maskinlæring er blevet et beviseligt vigtigt værktøj for retshåndhævelse til at bekæmpe ulovlige online markedspladser på det mørke web, " siger Lin Li, en hovedefterforsker af dette kontinuerlige arbejde i laboratoriets Human Dynamic Dark Networks-program, som er finansieret gennem laboratoriets Teknologikontor. "Men, nogle af de igangværende udfordringer og forskningsområder inkluderer at udvide vores forståelse af efterspørgselsøkonomien, forstyrre forsyningsøkonomien, og opnå en bedre overordnet situationsbevidsthed."

En bedre forståelse af, hvordan udbuds- og efterspørgselskæderne i den mørke webøkonomi fungerer, vil hjælpe teamet med at udvikle teknologier til at forstyrre disse kæder. En del af målet er at øge risikoen ved at deltage i denne ulovlige økonomi; at forbinde personas på det mørke web med dem på overfladens web er en potentielt stærk taktik.

"Denne hurtigt voksende illegale økonomi blev vist af DARPA for at finansiere terroraktiviteter og vist af HTRU som en drivkraft bag moderne slaveri. At besejre terrorisme og eliminere slaveri er nationale og humanitære behov, " siger Joseph Campbell, leder af Artifical Intelligence Technology and Systems Group. "Vores gruppe har ekstraordinær ekspertise inden for kunstig intelligens, maskinelæring, og analyse af menneskelige netværk baseret på information udvundet fra flersproget tale, tekst, og video kombineret med netværkskommunikation og aktiviteter. De state-of-the-art teknologier, som vi skaber, udvikle, og forskud overføres til vores sponsorer, som bruger dem dagligt med en enorm indvirkning på disse nationale og humanitære behov."

Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.




Varme artikler