Kredit:Shutterstock
Facebook annoncerede for nylig dramatiske begrænsninger for dataadgang på sin app og hjemmeside. Virksomheden indrammede nedlukningen som et forsøg på at beskytte brugeroplysninger, som svar på det offentlige ramaskrig efter Cambridge Analytica-skandalen.
Men beslutningen er i tråd med voksende restriktioner pålagt forskere, der studerer Facebook og dets fotodelingsapp Instagram, som også straks begyndte at begrænse adgangen til sine data den 4. april.
Faktisk, flere begrænsninger blev indført i februar i år, før Cambridge Analytica-fiaskoen - hvor data angiveligt blev høstet fra 50 millioner Facebook-profiler - brød ud offentligt. Facebooks API, version 2.5, var planlagt til at gå på pension i denne måned, ved – blandt andet – at forhindre adgang til ID for brugere, der deltager i offentlige fora.
Sociale netværk tilbyder to hovedindgange til indsamling af data:de fungerer som grænseflader for brugere og softwaregrænseflader designet til forbrug af computerprogrammer, kendt som Application Programming Interfaces (API'er).
Mens API'er er beregnet til programmører, der bygger apps, der tilføjer det voksende økosystem af tjenester, der tilbydes af sociale netværk, forskere har også udnyttet disse grænseflader til at studere social adfærd online.
I betragtning af den enorme størrelse af Facebooks brugerbase (2,13 milliarder ved sidste optælling), ekstern kontrol af indholdet på det sociale netværk er ekstremt vigtigt. I de seneste år, imidlertid, forskere har kæmpet en kamp op ad bakke med virksomheden for at give adgang til data. Nu har den seneste beslutning gjort det praktisk talt umuligt at udføre storstilet forskning på Facebook.
Ændringerne gør, at nedlagt software og biblioteker er dedikeret til akademisk forskning på Facebook, inklusive netvizz, NodeXL, SocialMediaLab, fb_scrape_public og Rfacebook, som alle var afhængige af Facebooks API'er til at indsamle data.
Systematisk forskning i Facebook-indhold er nu uholdbar, vende det, der allerede var en bekymrende uigennemsigtig, silede det sociale netværk ind i en sort boks, der nok er endnu mindre ansvarlig over for lovgivere og offentligheden - som begge nød godt af akademikere, der overvågede udviklingen på webstedet.
Deen Freelon, udvikleren af fb_scrape_public som analyserer store, offentligt tilgængelige datasæt på Facebook, fortalte os via e-mail, at "beslutningen om at begrænse adgangen til Pages API kan alvorligt svække indholdsbaseret Facebook-forskning fremover, afhængig af hvor villig Facebook er til at godkende adgang. Hvis den ikke godkender adgang til de fleste forskningsformål, der kunne skabe incitamenter for forskere til at skrabe Facebook direkte, som overtræder dets servicevilkår." Dataskrabning eller indsamling er en metode, hvorved et computerprogram udtrækker information fra websider.
Bernhard Rieder, en lektor ved universitetet i Amsterdam, der udviklede netvizz – et værktøj, der udtrækker data fra Facebook til forskningsformål – mener, at flytningen var en konsekvens af niveauet af uhindret adgang givet til alle indtil 2015, og at "der er en reel mulighed for, at disse tjenester vil i stigende grad være uudgrundelige og uobserverbare".
Indtil for tre år siden, Facebook tillod tredjepartsapps at have adgang til data om appbrugeres venner. Det var denne funktion, der blev brugt af Aleksandr Kogan, en forsker ved University of Cambridge.
Kogan – gennem sin Global Science Research-startup, som var adskilt fra hans akademiske arbejde - angiveligt indsamlede profiloplysninger fra 270, 000 Facebook-brugere og titusinder af deres venner ved hjælp af en personlighedstest-app kaldet "thisisyourdigitallife". Det hævdes, at Cambridge Analytica brugte disse data i et forsøg på at målrette politiske kampagner, herunder det amerikanske præsidentvalg i 2016.
Marc Smith, der ledede Microsoft-teamet, der skabte NodeXL, som analyserer sociale netværksdata, fortalte os, at der var mulighed for at gentænke de sociale netværk, folk vælger at bruge i lyset af dataskandalen.
Hvorfor API'er betyder noget
API'er giver forskere mulighed for at hente data i stor skala og kuratere databaser forbundet med meningsfulde begivenheder. Uden dem, webgrænseflader skal skrabes for at få adgang til dataene, hvilket er arbejdskrævende og drastisk begrænser mængden af information, der kan indsamles og behandles.
At låse forskere ude af API'erne begrænser dem til menneskeintensive metoder til dataindsamling, der ikke kan producere repræsentative prøver af begivenheder i den virkelige verden. såsom sociale bevægelser, valg og desinformationskampagner.
Twitter driver tre veldokumenterede, offentlige API'er ud over dets premium- og virksomhedstilbud. Twitters relative tilgængelighed fører til, at den er stærkt overrepræsenteret i forskning på sociale medier. Men offentlige og åbne API'er er en undtagelse i det sociale medie-økosystem. Facebooks Public Feed API, for eksempel, er begrænset til et begrænset sæt medieudgivere.
Datalåsning
Facebooks API-lockdown vil udvide kløften mellem industriforskere ansat af sociale netværk og forskere, der arbejder uden for virksomheder. Det er en kløft karakteriseret som kløften mellem "big data rige forskere", som har adgang til proprietære data og måske kun arbejder i den virksomheds interesse, de er tilknyttet, og "big data poor" eller det brede univers af akademiske forskere.
Facebooks beslutning udvider dramatisk denne pulje af "big data poor". Det begrænser forskningen til projekter sponsoreret af netværket og bringer potentielt forskning, der er kritisk over for Facebook, i fare.
Kort efter beslutningen om drastisk at begrænse API-adgang, Facebook lovede at hjælpe forskere med at få adgang til sociale mediedata af offentlig interesse, starting with elections. The announcement was met with a mix of celebration and subdued support from researchers.
Luca Rossi, who is associate professor at the IT University of Copenhagen, cautioned that the "data sharing model proposed by Facebook is deeply problematic and it will probably reinforce existing differences in terms of data access". The restriction is likely to continue the trend of researchers doing research they are able to as opposed to research they deem important.
Good news for research on the relationship between social media and society ( especially politics) - Facebook and funding foundations to set up a new model for industry- academic partnerships including third party scrutiny and peer review https://t.co/87gZm5PyIO
— Helen Margetts (@HelenMargetts) April 9, 2018
Fascinating how #Facebook has such a high barrier of access to its data for legitimate research purposes (a good thing) https://t.co/9ZcI4tyrS2 &yet allowed its system to be mined for data, weaponised &monetised by 3rd parties with just good coding skills &API access.
— Sanjana Hattotuwa (@sanjanah) April 9, 2018
I'm concerned that the right people are not at the table in terms decision making power and centering the most vulnerable people for research agendas. I'd love to be wrong about this. https://t.co/QiKsSf3ZRB
— Jill Dimond (@jpdimond) April 9, 2018
The impact on data science education is also considerable. If researchers are unable to access data from social networks, they will be unable to train students in data science, samfundsvidenskab, computer sciences and digital humanities on methods of data collection and analysis that are rigorous, critical and ethical.
Facebook's decision to render the API useless for meaningful research is a regrettable departure for collaboration between the social network giant and academics and it's already having an impact.
The Events API, which researchers relied on to retrieve information about public events such as demonstrations, no longer permits access to users or posts on the event wall.
Facebook's Groups API and Pages API were the endpoints researchers queried to study public discussions on Facebook, but the recent policy shift seals off those online conversations by restricting access to posts, comments or members participating in a public page or group.
The changes made to Instagram's API are even more radical, with Facebook deciding to deprecate the API – a technical term for killing data access altogether.
Nasty side effect
Facebook's decision to restrict researchers is ironic because academics have long discussed the problems that led to the Cambridge Analytica scandal. Rieder wrote about the risks of Facebook API's wide open data door back in 2013.
He cautioned against how much data a third-party app could get from Facebook. Facebook, imidlertid, ignored those concerns until 2015, when management and policies regulating the sharing of Facebook data took a sharp turn and became increasingly more restrictive for researchers.
Siden da, Facebook has become increasingly more cautious about external scrutiny. In the wake of the Cambridge Analytica scandal, Facebook CEO Mark Zuckerberg told Wired that the feedback it received was that "having the data locked down is more important to people than having different kinds of experiences".
The public uproar clearly underscores how users' data was poorly handled, but a lockdown is hardly the solution to a problem rooted in the weaponisation of social networks, where people use Facebook, Twitter and so on to spread disinformation.
The Cambridge Analytica scandal has created a worrying side effect:restricting access to data is likely to facilitate further weaponisation, by turning Facebook into a de facto black box that is largely unaccountable to external oversight.
Denne artikel blev oprindeligt publiceret på The Conversation. Læs den originale artikel.