Websites ønsker dine (anonymiserede) sociale mediedata

Balancering af privatlivets fred med detaljeret indsigt. Kredit:Dawn Hudson/Shutterstock.com

Sociale mediers websteders svar på Facebook-Cambridge Analytica-skandalen og nye europæiske fortrolighedsregler har givet brugerne meget mere kontrol over, hvem der kan få adgang til deres data, og til hvilke formål. Til mig, som bruger af sociale medier, det er positive udviklinger:Det er skræmmende at tænke på, hvad disse platforme kan gøre med de mange data, der er tilgængelige om mig. Men som forsker, øgede restriktioner for datadeling bekymrer mig.

Jeg er blandt de mange forskere, der er afhængige af data fra sociale medier for at få indsigt i folks handlinger. I et travlt med at beskytte enkeltpersoners privatliv, Jeg er bekymret for, at et utilsigtet tab kan være viden om menneskets natur. Mit seneste arbejde, for eksempel, analyserer følelser, folk udtrykker på Twitter for at forklare, hvorfor aktiemarkedet svinger så meget i løbet af en enkelt dag. Der er applikationer langt ud over finansiering. Andre forskere har undersøgt tilfredshed med ryttere i massetransport, alarmsystemers funktion under naturkatastrofer, og hvordan online interaktioner påvirker folks lyst til at føre en sund livsstil.

Dette udgør et dilemma - ikke kun for mig personligt, men for samfundet som helhed. De fleste mennesker ønsker ikke, at sociale medieplatforme deler eller sælger deres personlige oplysninger, medmindre det er specifikt godkendt af den enkelte bruger. Men som medlemmer af et kollektivt samfund, Det er nyttigt at forstå de sociale kræfter på arbejdet, der påvirker hverdagen og langsigtede tendenser. Inden de seneste kriser, Facebook og andre virksomheder havde allerede gjort det svært for legitime forskere at bruge deres data, herunder ved at gøre det vanskeligere og dyrere at downloade og få adgang til data til analyse. Det fornyede offentlige pres for privatliv betyder, at det sandsynligvis vil blive endnu hårdere.

Brug af sociale mediedata i forskning

Det er helt sikkert alarmerende at overveje udsigten til, at mennesker eller virksomheder kan analysere mine data og finde måder at påvirke mig til at træffe beslutninger, som jeg ellers ikke ville have - eller som endda er i modstrid med mine egne interesser. Jeg behøver kun at tænke på antallet af gange, jeg har set en tv -annonce for pizza under et sportsbegivenhed og bestilt en pizza.

Det er pointen med marketing, selvfølgelig - men sociale medier er forskellige, fordi oplysningerne handler om mig specifikt. Og at bruge disse oplysninger kan påvirke meget mere end den mad, jeg køber, sådan som jeg stemmer på. Imidlertid, som forsker i finansiering, Jeg erkender også, at de samme data kan bruges til at hjælpe os med at forstå kollektiv adfærd, der ellers er umulig at forklare.

Nogle af mine undersøgelser, for eksempel, udforsker kortsigtede tendenser i aktiekurser. Finansielle eksperter har fundet ud af, at på lang sigt en virksomheds aktiekurser er drevet af virksomhedens fremtidige værdi. Men i løbet af en enkelt dag, aktiekurser kan variere meget. Mange finansforskere og finansanalytikere vil fortælle dig, at disse bevægelser er meningsløs støj, tilsyneladende tilfældige oplysninger om virksomheder, der påvirker investorernes opfattelse og får aktiekurserne til at variere konstant.

Men ved at analysere data fra sociale medier, Jeg kan faktisk forstå, hvad den støj er, hvor det kommer fra, og hvad det betyder. For eksempel, hvad folk skriver på Twitter om den nye iPhone vil påvirke Apples aktiekurs, nogle gange inden for få minutter - men endda i løbet af dage. Effektens hastighed afhænger af vigtigheden eller fremtrædelsen af den person, der sender tweetet, samt hvor hurtigt andre - herunder medierne - opfanger beskeden.

Resultater fra min forskning kan hjælpe investorer med at finjustere, hvornår og hvordan de kommer ind på markedet. Hvis, for eksempel, brugere af sociale medier mener, at den nyeste iPhone ikke vil være så god som forventet, investorer kan holde op med deres investering i Apple -aktier. Det kunne frigøre dem til at investere i noget andet med bedre buzz, i håb om højere afkast.

Anonymisering af data

Det er rigtigt - og angående - at nogle formodentlig uetiske mennesker har forsøgt at bruge sociale mediedata til deres egen fordel. Men dataene er ikke det egentlige problem, og at skære forskernes adgang til data er ikke løsningen. Hvis du gør det, vil det også fratage samfundet fordelene ved analyse af sociale medier.

Heldigvis, der er en måde at løse dette dilemma på. Anonymisering af data kan holde folks individuelle privatliv intakt, samtidig med at forskere får adgang til kollektive data, der kan give vigtig indsigt.

Der er endda en stærk model for, hvordan man kan finde den balance effektivt:U.S. Census Bureau. I årtier, at det offentlige organ har indsamlet ekstremt personlige data fra husstande i hele landet:aldre, Beskæftigelsesstatus, indkomstniveau, CPR -numre og politiske tilhørsforhold. Resultaterne, den offentliggør, er meget rige, men kan heller ikke spores til nogen.

Det er ofte teknisk muligt at vende anonymitetsbeskyttelse på data, ved hjælp af flere stykker anonymiseret information til at identificere den person, de alle relaterer til. Census Bureau tager skridt til at forhindre dette.

For eksempel, når medlemmer af offentlighedsoplysninger om folketællinger, Census Bureau begrænser oplysninger, der sandsynligvis vil identificere bestemte personer, f.eks. rapportering er der kun én person i et samfund med et særligt højt eller lavt indkomstniveau.

For forskere er processen noget anderledes, men giver betydelig beskyttelse både i lov og i praksis. Forskere skal bestå Census Bureau's kontrolproces for at sikre, at de er legitime, og skal gennemgå uddannelse i, hvad de kan og ikke må med dataene. Strafferne for overtrædelse af reglerne omfatter ikke kun at blive forhindret i at bruge folketællingsdata i fremtiden, men også borgerlige bøder og endda strafferetlig forfølgelse.

Selv da, hvad forskere får, kommer uden navn eller personnummer. I stedet, Census Bureau bruger det, det kalder "beskyttede identifikationsnøgler, "et tilfældigt tal, der erstatter data, der gør det muligt for forskere at identificere personer.

Hver persons data er mærket med sin egen identifikationsnøgle, tillader forskere at forbinde oplysninger af forskellige typer. For eksempel, en forsker, der ønsker at spore, hvor lang tid det tager folk at afslutte en universitetsuddannelse, kan følge individers uddannelsesniveau over tid, takket være identifikationsnøglerne.

Sociale medieplatforme kunne implementere en lignende anonymiseringsproces i stedet for at øge forhindringer - og omkostninger - for at få adgang til deres data. De kunne tildele brugerne identifikationsnumre i stedet for at dele deres rigtige identiteter, og kunne acceptere regeringens bestemmelser, der definerer, hvem der kan få adgang til hvilke data, herunder reelle sanktioner for overtrædelse af reglerne. Derefter kunne forskere opdage den indsigt, der tilbydes af brug af sociale medier, ligesom de gør med folketællingsdata, uden at true folks privatliv.

Denne artikel blev oprindeligt offentliggjort på The Conversation. Læs den originale artikel.

Sidste artikelAirbnb sletter Japans annoncer forud for ny lejelov

Næste artikelFacebook siger, at kinesiske telefonproducenter fik adgang til data (opdatering)