Videnskab
 science >> Videnskab >  >> Elektronik

Rygtemøllens daglige grin:Machine learning dechifrerer falske nyheder

Kredit:Pixabay/CC0 Public Domain

Forskning offentliggjort i International Journal of Cloud Computing ser på, hvordan maskinlæring kan give os mulighed for at analysere arten og karakteristikaene af sociale medieopdateringer og opdage, hvilke af disse opdateringer, der tilføjer gryn til rygtemøllen i stedet for at være faktuelle.

Falske nyheder har været med os lige siden den første sladder videregav et rygte dengang. Men med fremkomsten af ​​sociale medier er det nu så meget nemmere at sprede falske nyheder, desinformation og propaganda til et stort globalt publikum med få begrænsninger. Et rygte kan skabe eller ødelægge et ry. I disse dage kan det ske verden over gennem de sociale mediers forstærkende ekkokammer.

Mohammed Al-Sarem, Muna Al-Harby, Faisal Saeed og Essa Abdullah Hezzam fra Taibah University i Medina, Saudi-Arabien har undersøgt de forskellige tekstforbehandlingstilgange til at nærme sig de enorme mængder data, der strømmer fra sociale medier på daglig basis . Hvor godt disse tilgange virker i den efterfølgende rygtedetekteringsanalyse er afgørende for, hvor godt falske nyheder kan spottes og stoppes. Holdet har testet forskellige tilgange på et datasæt af politiske nyhedsrelaterede tweets fra Saudi-Arabien.

Forbehandling kan se på de tre mest relevante karakteristika ved en opdatering, inden tekstanalysen udføres, og silo de forskellige opdateringer derefter:For det første kan den se på brugen af ​​spørgsmålstegn og udråbstegn og ordantal. For det andet kan den se på, om en konto er verificeret eller har egenskaber oftere forbundet med en falsk eller bot-konto, såsom tweet-antal, svar, retweets osv. For det tredje kan den se på brugerbaserede funktioner, såsom brugeren navn og brugerens logo eller profilbillede.

Forskerne fandt ud af, at forbehandling kan forbedre analysen betydeligt, når outputtet føres til en hvilken som helst af støttevektormaskine (SVM), multinomial naive Bayes (MNB) og K-nearest neighbor (KNN) klassifikatorer. Disse klassifikatorer reagerer dog forskelligt afhængigt af hvilken kombination af forbehandlingsteknikker, der anvendes. For eksempel at fjerne stopord og rydde ud i kodningstags, såsom HTML, stemming og tokenisering. + Udforsk yderligere

Undersøgelse viser, at verificerede brugere er blandt de største syndere, når det kommer til at dele falske nyheder