Facebook-dataindsamling – hvad du behøver at vide

Et voksværk af Facebook-chef Mark Zuckerberg. Kredit:Shutterstock

Facebook tjener størstedelen af sine penge på annoncering, og – da Cambridge Analytica-skandalen fortsætter med at hjemsøge Mark Zuckerbergs virksomhed – kræver brugere at vide, hvordan deres data bliver skændtes og høstes.

Men mens bekymringen for Facebook-brugeres privatliv er steget, det har været klart siden Facebooks start, at dets forretning er baseret på udbredt overvågning af mennesker, hvis data er produktet.

Nogle har portrætteret afsløringerne af Cambridge Analytica-skandalen – hvor data angiveligt blev høstet fra 50 millioner Facebook-profiler – som en "eksistentiel krise". mens andre har fremhævet potentielle implikationer for akademisk forskning.

Kort sagt, Facebooks dataindsamlingsmetoder er blevet genstand for pludselig og udbredt bekymring.

Hvad er dataindsamling?

Høstdata, som dets landbrugsnavn antyder, ligner indsamling af afgrøder, fordi det involverer indsamling og opbevaring med forventning om fremtidig belønning.

Data kan høstes på forskellige måder, lige fra simpel kopi-og-indsæt til mere kompliceret programmering. Den valgte metode er ofte begrænset af det sted, der høstes. På simple søgeniveauer, mange websteder bekæmper automatiseret høst med Google CAPTCHA'er og reCAPTCHA'er, som hjælper websteder med at skelne mellem mennesker og bots.

Hvis du nogensinde har kopieret og indsat tekst fra Facebook eller gemt et billede fra Twitter, du har høstet data på sociale medier. Handlingen "screenshotting" er tilladt på de fleste websteder, fordi brugere normalt kun kan få adgang til information, der enten er offentlig eller synlig for dem, fordi de har logget ind. det ville være umuligt helt at udrydde de enkleste dataindsamlingsmetoder, såsom at lave noter og tage billeder.

Facebook og andre sociale netværk er mere optaget af at begrænse automatiseret dataindsamling, på grund af krav til webservere og for at kontrollere, hvem der har adgang til hvilke data (og hvorfor). Personlige oplysninger og adfærd på sociale medier har kommercielle, politisk og forskningsmæssig værdi.

Sociale netværk bestemmer deres egne brugspolitikker, afvejning af kommercielle interesser med tredjeparter og lovgivningsmæssige bekymringer om brugernes privatliv – ofte beskrevet i virksomhedens dokumenter som jonglering med optimering af "kundeadfærd" og overholdelse af "fællesskabsstandarder".

Hvordan høstes data?

Application Programming Interfaces (API'er) bruges af Facebook, Twitter, Instagram og andre websteder for at begrænse potentielle høstmænds adgang. API'er fungerer som et softwaremellemstykke, der gør det muligt for en forsker eller appudviklers computer at "tale" til et socialt netværk på en kontrolleret måde.

Læs mere:Hvordan Cambridge Analyticas Facebook-målretningsmodel virkelig fungerede – ifølge den person, der byggede den

En af hovedbetingelserne involverer begrænsninger for, hvordan indsamlede data kan bruges og deles, som kan forfølges aggressivt. I 2010, computerprogrammøren Pete Warden høstede data fra 210 millioner offentlige Facebook-profiler til forskningsformål. Men han undlod at søge tilladelse fra Facebook først, derved overtræder dets servicevilkår. Han stod senere over for truslen om juridiske skridt fra Facebook og blev tvunget til at slette dataene - i et ekko af den akademiske forsker Aleksandr Kogans påståede del i Cambridge Analytica-skandalen.

Kogans app, døbt "thisisyourdigitallife", udviklet i 2014 gennem hans firma Global Science Research (GSR) – adskilt fra hans universitetsarbejde – var en personlighedstest, der 270, 000 brugere logget ind, acceptere, at det ville have adgang til nogle af deres personlige oplysninger og nogle af deres venners data også. Det betød også, at disse venner ikke havde givet samtykke til, at deres data blev brugt på denne måde.

Facebook opdaterer rutinemæssigt sin API, og i 2014 bekræftede virksomheden, at det ville stoppe med at tillade tredjepartsapps at få adgang til data om appbrugeres venner. Dette deaktiverede den dataindsamlingsmetode, der angiveligt blev brugt af Kogan.

Der er et par forskellige måder, udviklere – som er forpligtet til at acceptere Facebooks politikker – kan høste data ved hjælp af virksomhedens API, og de påtager sig alle i det mindste grundlæggende computerprogrammeringsfærdigheder. En af de nemmeste måder at gøre dette på er at få adgang til API'et ved hjælp af en specialistsoftwareværktøjskasse - Python og R har værktøjer designet specifikt til dette formål. I min forskning, Jeg bruger Rfacebook-pakken til at høste Facebook-data.

En vigtig skelnen mellem min app og andre er, at jeg ikke interagerer med brugere, fordi min app ikke er live. Min app er i bund og grund en automatiseret måde at kopiere og indsætte oplysninger fra offentlige Facebook-grupper på. Jeg bruger Facebook API til at undersøge, hvordan offentlige gruppers sider er blevet brugt til at protestere mod besparelser i Irland.

Fordi jeg høster offentlige data fra offentlige sider, Jeg beder ikke brugere om at logge ind, og der er ingen frontend-grænseflade på Facebook, selvom dette kan gøres ved hjælp af Facebooks API-værktøjssæt til at udvide mængden af data, der kan tilgås. Det er en metode, der rejser en række spørgsmål om funktionalitet, brugeroplysninger og adgangstilladelser.

Facebooks API kan bruges til at høste alle mulige offentligt tilgængelige oplysninger, som nogle af The Conversation UKs seneste indlæg eller indlæg i offentlige grupper.

Men forsøg på at gå ud over offentlig information for at indsamle data fra Facebook-brugere, der ikke er logget ind på appen – såsom Zuckerberg, for eksempel – returfejl. Facebook "synes godt om" kan ikke høstes, fordi Zuckerberg ikke er bruger af min app, og han har ikke givet den tilladelse til at få adgang til hans data.

Under Facebooks seneste API-opdateringer, app-tilladelser er påkrævet for at indsamle alle oplysninger ud over offentlige profilegenskaber. Det betyder, at brugere skal logge ind på en app og godkende adgang til enhver anden information for at give udviklere mulighed for at høste dataene.

Lovlig forskning truet?

Mens reklamefyldte virksomheder helt klart har en interesse i at "udnytte" data, akademikere – de seneste uger – har henledt opmærksomheden på forskere, der høster Facebook-data. Denne praksis er blevet relativt mainstream i samfundsvidenskabelig forskning.

Det er presserende, i hvilket omfang fremtidig forskning kan begrænses af ændringer i Facebooks API. Men det er værd at bemærke, at når data er blevet indsamlet, Facebook – som lovligt kan forfølge folk, der "overtræder" dets servicevilkår for at forsøge at tvinge dem til at slette data – har begrænset kontrol over, hvor data der ender.

For forskere, der bekymrer sig om, hvordan Cambridge Analytica-skandalen vil påvirke deres arbejde, det er værd at holde øje med, hvilke ændringer Facebook implementerer i sin næste API-opdatering. Det kan give en bedre forståelse af, hvilken type forskning, der kan tillades ved brug af indsamlede Facebook-data – og hvad der kan være permanent udelukket.

Denne artikel blev oprindeligt offentliggjort på The Conversation. Læs den originale artikel.

Sidste artikelHuspanel siger, at Facebooks Zuckerberg vidner 11. april

Næste artikelVejen til et blomstrende australsk marked for termisk solenergi