Videnskab
 science >> Videnskab >  >> Elektronik

Ny applikation kan registrere Twitter-bots på ethvert sprog

Kredit:CC0 Public Domain

Takket være et frugtbart samarbejde mellem sprogforskere og maskinlæringsspecialister, en ny applikation udviklet af forskere ved University of Eastern Finland og Linnaeus University i Sverige kan opdage Twitter-bots uafhængigt af det anvendte sprog.

I de seneste år, big data fra forskellige sociale medieapplikationer har forvandlet nettet til et brugergenereret lager af information på et stadigt stigende antal områder. På grund af den relativt nemme adgang til tweets og deres metadata, Twitter er blevet en populær kilde til data til undersøgelser af en række fænomener. Disse omfatter, for eksempel, forskellige politiske kampagner, sociale og politiske omvæltninger, Twitter som et værktøj til nødkommunikation, og ved at bruge sociale mediers data til at forudsige aktiemarkedspriser.

Imidlertid, forskning ved hjælp af data fra sociale mediers data er ofte skæv af tilstedeværelsen af ​​bots. Bots er ikke-personlige og automatiserede konti, der sender indhold til online sociale netværk. Populariteten af ​​Twitter som et instrument i den offentlige debat har ført til en situation, hvor det er blevet et ideelt mål for spammere og automatiserede scripts. Det er blevet anslået, at omkring 5-10 % af alle brugere er bots, og at disse konti genererer omkring 20-25 % af alle udsendte tweets.

Forskere fra de digitale humaniora ved University of Eastern Finland og Linnaeus University i Sverige har udviklet en ny applikation, der er afhængig af maskinlæring til at opdage Twitter-bots. Applikationen er i stand til at registrere autogenererede tweets uafhængigt af det anvendte sprog. Forskerne fangede til analyse i alt 15, 000 tweets på finsk, svensk og engelsk. Finsk og svensk blev hovedsageligt brugt til træning, hvorimod tweets på engelsk blev brugt til at evaluere applikationens sproguafhængighed. Applikationen er let, gør det muligt at klassificere enorme mængder data hurtigt og relativt effektivt.

"Dette forbedrer kvaliteten af ​​data - og tegner et mere præcist billede af virkeligheden, ", bemærker professor i engelsk Mikko Laitinen fra University of Eastern Finland.

Ifølge professor Laitinen, bots er relativt harmløse, hvorimod trolde gør skade, når de spreder falske nyheder og kommer med opdigtede historier. Det er derfor, der er behov for stadig mere avancerede værktøjer til overvågning af sociale medier.

"Dette er et komplekst spørgsmål og kræver tværfaglige tilgange. F.eks. vi lingvister arbejder sammen med maskinlæringsspecialister. Denne type arbejde kræver også beslutsomhed og investeringer i forskningsinfrastrukturer, der fungerer som en platform for forskere fra forskellige felter at samarbejde om."

Ifølge professor Laitinen, det er essentielt for forskere at have adgang til sociale mediedata.

"I øjeblikket, data tilhører amerikanske teknologikonglomerater, og en kilde til deres indtægt. For at forskere kan få adgang til disse data, samarbejde på nationalt og internationalt plan, og især inddragelse af EU er nødvendig."