Et nyt kunstig intelligens-værktøj, der er skabt til at hjælpe med at identificere visse former for stofmisbrug baseret på en hjemløs ungdoms Facebook-opslag, kunne give hjemløse krisecentre vital information, som de kan indarbejde i hver enkelt persons sagsbehandlingsplan. Kredit:CC0 Public Domain
Det ser ud til, at julen kommer tidligt i år for samfundsforskere.
Det er fordi, blot måneder efter Albert J. Weatherhead III University Professor Gary King skrev et akademisk papir om et system, der ville give forskere adgang til de massive databeholdninger, som Facebook og andre private virksomheder har, det er klar til at blive en realitet.
Sammen med sin samarbejdspartner Nathaniel Persily på Stanford, King skabte en organisation kaldet Social Science One, som skal lede indsatsen for at identificere data inde på Facebook, forberede det til forskere, og finansiere adskillige forskere til at analysere dataene.
Organisationen gør i dag det første af, hvad King siger, vil være mange datasæt tilgængelige for forskning - en massiv samling på mere end en halv trillion tal, der inkluderer hvert link, der nogensinde er klikket på af Facebook-brugere i det sidste år, herunder typen af mennesker, der har klikket, hvad de klikkede på, og indikatorer for, om links blev vurderet til at være bevidst falske nyhedshistorier.
"Som samfundsforskere, vores mål er at forstå og løse de største udfordringer, der påvirker det menneskelige samfund, " sagde King. "For tyve år siden, næsten alle data i verden til at løse disse udfordringer blev skabt af os i akademiet, af regeringer og givet til os, eller af private virksomheder og solgt til os, " sagde han. "Men problemet er, at selvom vi har flere data end nogensinde før, vi har en mindre del af de data, som verden skaber. De fleste af de data, der ville være nyttige for samfundsvidenskab, er nu låst inde i private virksomheder. Social Science One er en vigtig mekanisme til at låse op for disse data for samfundsforskere."
Og mængden af data, de vil have adgang til, er næsten ud over at forestille sig.
"De data, vi vil give adgang til, er ekstraordinære - i mængde kan de konkurrere med den samlede mængde data, der i øjeblikket findes i samfundsvidenskaberne."
"Denne kommission har potentiale til at åbne et nyt kapitel i samfundsvidenskabelig forskning, og i den overordnede tilegnelse af viden, hvor de organisationer, der besidder kritisk vigtig information om mennesker og institutioner, som sociale medieplatforme, og professionelle forskere vil være i stand til at samarbejde mere effektivt for at løse nogle af de sværeste problemer, som vores samfund står over for, " sagde Matthew Baum, Marvin Kalb professor i global kommunikation ved Harvard Kennedy School, og medlem af Social Science One-kommissionen.
Skitseret af King og Persily i et arbejdspapir i april, rammerne, der underbygger Social Science One, består af to dele.
Den første, han sagde, er en kommission af fremtrædende akademikere fra hele kloden, som vil arbejde sammen med Facebook-embedsmænd for at identificere potentielle datasæt, som de vil gøre tilgængelige for forskere gennem en proces, hvor undersøgelsesforslag indsendes og peer review. Når studieideerne er godkendt, forskere får adgang til dataene samt bevillinger til at støtte deres arbejde leveret af syv velgørende fonde. Fondene spænder over det ideologiske spektrum, men deres penge er samlet, og alle beslutninger vil blive truffet af akademikere, og så ingen synspunkter kan dominere. Og de eksterne forskere vil have fuldstændig akademisk frihed uden at skulle give Facebook rettigheder til forhåndsudgivelsesgodkendelse.
"Den centrale del af processen er, at kommissionen, som en betroet tredjepart, kan se på forslagene og beslutte, at nogle ikke skal finansieres - selv om det er videnskabeligt passende - af årsager, der ikke er offentligt kendte, som hvis de ville berøre retssager, der ikke er blevet offentliggjort, " fortsatte han. "Og hvis Facebook giver afkald på denne aftale og ikke gør data tilgængelige, som Social Science One anmoder om, vi er forpligtet til at rapportere det til offentligheden. Så dette system er incitamentkompatibelt for offentligheden, for virksomheden, og for det samfundsvidenskabelige samfund. Vi tænker på dette som i det væsentlige et værk af statskundskab, hvor vi kom med en forfatning, der virker for alle partier.«
Social Science One bliver inkuberet på Harvard's Institute for Quantitative Social Science, som Kongen instruerer. I årenes løb, IQSS har påtaget sig denne type aktivitet mange gange. Det har regelmæssigt inkuberet og udskilt nonprofit-forskningsgrupper og for profit-virksomheder, samt centre, programmer, og forskningsprojekter, der nu har til huse på IQSS, andetsteds på Harvard, og på andre institutioner.
Hvor spændende det end kan være for forskere at få adgang til Facebooks datalager, brugen – og misbrugen – af Facebook-data har skabt verdensomspændende overskrifter i de seneste måneder, noget King og kolleger har udviklet procedurer for at undgå. De indbyggede sikkerhedsforanstaltninger i deres procedurer, hvoraf den første er enkel – forskere får ikke Facebook-data, de vil kun få adgang til det.
"Ingen akademiker vil få udleveret data, ligesom før, " sagde King. "I stedet, vi vil gøre dataadgang tilgængelig for akademikere, så den enkeltes privatliv altid bevares."
Ud over, organisationen planlægger at gøre brug af et matematisk koncept kendt som "differentiel privatliv, " for at sikre, at de data, der stilles til rådighed, ikke kan spores tilbage til individuelle brugere. "Vi har nogle af de førende eksperter i verden, der studerer dette koncept her på Harvard, herunder Cynthia Dwork, Gordon McKay professor i datalogi ved Harvard John A. Paulson School of Engineering &Applied Sciences, og Salil Vadhan, Vicky Joseph professor i datalogi og anvendt matematik, som begge er medlemmer af kommissionen, " sagde King. "Ideen er, at du kan tage et datasæt og tilføje specielle typer tilfældig støj for at gøre det umuligt at identificere en enkelt person, men når du samler det, det ændrer ikke de overordnede mønstre, du ønsker at undersøge."
Men langt den stærkeste sikkerhedsforanstaltning, Kongen sagde, er relateret til det system, der giver akademikere adgang til dataene. "Når akademikere får adgang til dataene, hvert tegn, de skriver, bliver logget og revideret, " sagde han. "Så hvis de skriver bogstavet 'k, ' Vi ved, at de har skrevet det brev. Så der er ingen mulighed for, at de kopierer eller misbruger dataene. Det betyder, at vi skifter fra en model for individuelt ansvar, der får forskeren til at overtræde reglerne som et enkelt fejlpunkt, til en med kollektivt ansvar, hvor ingen person kan krænke privatlivets fred, uden at alle ved det og kan stoppe det."
Ultimativt, Kongen sagde, Målet med Social Science One er at udvikle måder, hvorpå Facebook – og i sidste ende andre virksomheder – kan gøre deres enorme datalagre tilgængelige for forskere i håbet om at finde løsninger på de sociale problemer, der fortsat plager menneskeheden.
"Facebook har meget informative data om to milliarder mennesker, " sagde King. "Det er et utroligt privilegium, og med privilegiet følger et betydeligt ansvar. Det giver kun mening, at Facebook også bruger noget af den information og magt til at hjælpe offentligheden og bidrage til socialt gode."
Det er en idé, der ikke er uden fortilfælde, sagde King.
Gennem årtierne, flere store virksomheder har bygget store forskningsafdelinger – måske mest bemærkelsesværdigt med oprettelsen af Bell Labs af AT&T og Microsoft Research hos Microsoft – der gav videnskabsmænd frihed til at udforske emner så forskellige som informationsteori til udvikling af lasere og udvikling af transistorer.
Med udgivelsen af det første datasæt i dag, King og kolleger håber på at fortsætte den tradition - men på en måde, der er designet specielt til de samfundsvidenskabeligt relaterede virksomheder.
"Dette er blot vores første datasæt - vi har en hel del andre, der vil komme efter dette, og vi har midler fra syv generøse fonde, og så håber vi at begynde at få forskere hurtigt op at køre, " sagde King. "Vi håber også at udvide dette samarbejde ud over Facebook og også at samarbejde med andre virksomheder."
"De opdagelser, vi gør ved hjælp af disse datasæt, kommer ikke til at afbryde disse virksomheders forretninger, men de kunne hjælpe med at løse nogle af de udfordringer, der påvirker det menneskelige samfund, " sagde King. "Og hvis der er en måde at gøre det på, hvem vil ikke gerne bidrage til den mission?"