Kredit:CC0 Public Domain
Når du læser dette, kokain, dusører, og andre ulovlige produkter og tjenester bliver købt og solgt på snesevis af anonyme online markedspladser. Disse markedspladser er svære at lukke ned, fordi de findes på netværk, der er begravet under krypteringslag, hvilket gør det ekstremt svært at fastslå identiteten af de involverede.
For at gøre tingene værre for retshåndhævelse, nogle produktive sælgere vil undgå målretning ved at drive flere konti, der ser ud til at være individuelle sælgere med mindre mængder produkt. De retshåndhævende myndigheder sidder tilbage med hovedpine, men de er ikke de eneste.
"Når sælgere bruger flere konti, det er meget svært for forskere at få et præcist billede af, hvordan disse markedspladser rent faktisk ser ud, "siger Xiao Hui Tai, en tidligere CyLab Ph.D. studerende på Institut for Statistik &Datavidenskab. "Forskere og retshåndhævelse vil begge gerne kende de sande størrelser af disse underjordiske markeder."
I en undersøgelse præsenteret på Knowledge Discovery and Data (KDD) Mining Conference, Tai gik sammen med to andre forskere om at udvikle en algoritme, der er i stand til at opdage, når tilsyneladende forskellige konti tilhører den samme sælger. Teamet testede deres algoritme på otte års data indsamlet fra et dusin online anonyme markedspladser.
"Vores algoritme registrerede over 20, 000 konti tilhørende cirka 15, 000 individuelle sælgere, "Sagde Tai." Nogle af disse mennesker opererede mellem to og 11 konti. "
Algoritmen fungerede ved at udtrække kontooplysninger - ting som kontonavne, produkter, der sælges på disse konti, priser, hvor regnskabet blev sendt til og fra, og den slags ord, der bruges i regnskabernes profiler - og sammenligne dem med hinanden. Hvis yderligere to konti delte lignende træk over en bestemt tærskel, algoritmen matchede dem med den samme sælger.
Også udtrukket af algoritmen var en kontos PGP -nøgle - en unik bit kode, som giver købere mulighed for at kryptere og godkende kommunikation med sælgere. Mens tidligere undersøgelser har brugt PGP -nøgler til at matche konti med sælgere, Tai's undersøgelse kombinerede det med de ovenfor beskrevne egenskaber for mere præcis matchning.
For eksempel, algoritmen opdagede en samling af konti, der havde den samme PGP -nøgle, men stemplede dem alle som værende drevet af forskellige sælgere, fordi andre oplysninger i disse konti var så forskellige. Det viste sig, at det hollandske nationale politi havde beslaglagt disse konti og bogført den samme PGP -nøgle til dem alle; hvis nogen forsøgte at kommunikere med sælgers konto, politiet ville kunne dekryptere det.
"Hvis vi kun skulle bruge PGP -nøgler til at matche konti, vi ville have troet, at disse alle tilhørte den samme person, "Sagde Tai." Men faktisk, modellen forsikrede os om, at de ikke var de samme. "
Ofte, Tai sagde, konti ville efterligne andre konti, der drives af forskellige sælgere ved at bruge lignende tekststykker i deres profil. Efterligning ville gøre det muligt for en konto at piggy-back på en andens gode ry som sælger.
"I et tilfælde, en kontoprofil læst, 'Der er en konto derude, der hævder at være os, men de efterligner os bare, '"Sagde Tai." Ved hjælp af andre oplysninger end blot profilteksten, modellen var i stand til at bestemme, at regnskaberne tilhørte forskellige sælgere. "
Til sidst, Tai sagde, et af de vigtigste mål med retshåndhævelse er at lære, hvem folk er bag disse konti, og matchingsalgoritmen er et skridt i retning af at nå dette mål.
"Når du er i stand til at fange forskellige oplysninger fra forskellige konti og sige, at de tilhører den samme person, "Sagde Tai, "... så kan du kombinere alle disse oplysninger for at hjælpe med at generere undersøgelsesemner."