Kredit:CC0 Public Domain
På et tidspunkt, hvor det sociale netværks privatliv – eller manglen på det – er hovednyheder, to Stanford-forskere har nogle nøgterne resultater om, hvordan personlige data bliver stadig sværere at skjule, hvis vi har nogen offentlig tilstedeværelse online.
I et papir udgivet denne måned i Naturen Menneskelig adfærd , Johan Ugander, assisterende professor i ledelsesvidenskab og ingeniørvidenskab, og Kristen Altenburger, en ph.d. studerende i sit laboratorium, har vist, at der er flere måder end tidligere indset til at afsløre demografiske træk, som folk måske forsøger at skjule. Dette arbejde bygger på en af hovedtrådene i privatlivsforskning, som er at forstå, hvordan forskellige egenskaber hænger sammen.
Stanford-papiret er baseret på databaser, der er gjort tilgængelige specifikt til forskning. Disse afspejler den slags information, som websteder gør tilgængelige for annoncører eller afslører for eksterne grupper, når folk tillader tredjeparter at få adgang til deres sociale profiler. I betragtning af udbredelsen af sådanne data, forskerne forsøgte bedre at forstå, hvilke slags statistiske slutninger der kunne ende med at afsløre træk, folk har søgt at skjule.
"I sociale data, nogle ting er mere forudsigelige end andre, " sagde Ugander. "Vi satte os for at studere forholdet mellem vennenetværk og forudsigelighed, og endte med at afsløre en slutningsmekanisme, som ikke var blevet bemærket før."
Niveauer af inferens
På det enkleste niveau afslører folk information om sig selv baseret på, hvordan de opfører sig online. Hvis en person køber bleer online, for eksempel, de har sikkert en baby. Det er en direkte slutning.
En anden form for slutning er baseret på at se på vores venner, eller indirekte slutning. Forskere, der har undersøgt relationer på sociale medier, har fundet ud af, at vi har en tendens til at blive venner med mennesker på nogenlunde samme alder, race og politisk tro. Så selvom en person ikke afslører deres alder, race eller politiske holdninger, disse træk kan let og præcist udledes af venskabsstudier. Forskere kalder denne tendens homofil, som stammer fra de græske ord for kærlighed til ensartethed.
Men ikke alle ukendte træk er nemme at forudsige ved hjælp af venneundersøgelser. Køn, for eksempel, udstiller, hvad forskere kalder svag homofili i online sammenhænge.
"Hvis en ukendt person i et socialt netværk for det meste har mandlige venner, er der en næsten lige så god chance for, at de kan være kvinder, eller omvendt, " sagde Altenburger.
Venner af venner
Gruppens nye forskning viser, at det er muligt at udlede visse skjulte træk – køn er det første – ved at studere vores venners venner.
Denne teknik virker, fordi Ugander og Altenburger har beskrevet en ny social struktur, de kalder monofili, Græsk for "kærlighed til en, " hvor folk har ekstreme præferencer for egenskaber, men ikke nødvendigvis deres egne karaktertræk. "F.eks. " sagde Ugander, "I gennemsnit kan det være tilfældet, at mænd ikke har en klar præference for mandlige eller kvindelige venner, men det gennemsnit kan tilsløre det faktum, at nogle mænd har stærke præferencer for mandlige venner, mens andre har stærke præferencer for kvindelige venner."
De observerer, at når der er monofili i et netværk, det bliver muligt at forudsige karaktertræk hos individer baseret på venners venner, selv i situationer, hvor der ikke er nogen homofili.
Stanford-teamet stolede på standardnetværksdatasæt, der er bredt undersøgt af akademikere. Disse datasæt kortlægger venskabsnetværk og indeholder fuldstændig information om alle træk ved alle de individuelle træk, herunder køn. Forskerne slettede derefter kønsdata for visse individer, skabe kunstige ukendte, og brugte derefter deres "venners venner"-analyse til at se, om det kunne give en forudsigelse.
"Det er et udfyldningsproblem, " sagde Ugander. "Og selvom vi opdager, at dine venner ikke har en tendens til at forudsige dit køn, de mennesker disse venner vælger at omgås, dine venners venner, har tendens til at ligne dig mere, end selv dine venner er."
Forskerne sagde, at kraften i deres nye perspektiv, at se på vores venners venner, fremhæver vigtigheden af at beskytte netværksdata mod nysgerrige hænder. Enhver politikløsning til at bevare netværkets privatliv skal tage hensyn til de oplysninger, der findes blandt ens venners venner. De genbruger nu deres teknik på andre ukendte for at se, hvad der ellers kan blive afsløret af venners venner.
"Vi er ikke sikre på, hvad der ellers kan blive afsløret på denne måde, " sagde Ugander, tilføjer:"Desværre, det ser ud til, at området for netværksbeskyttelse er endnu mindre, end vi tidligere troede."