Videnskab
 science >> Videnskab >  >> Elektronik

Algoritmer afslører mønstre, der hjælper med at bekæmpe falske nyheder

Kredit:University of California - Riverside

I februar, Justitsministeriet anklagede 13 russere for at stjæle amerikanske borgeres identiteter og sprede "falske nyheder" med det formål at undergrave det sidste amerikanske præsidentvalg. Sagen udfolder sig stadig, og kan gøre det i årevis. I mellemtiden, UCR-forskere har bygget en teknologibaseret løsning til formidling af ondsindet misinformation.

UCR's Multi-Aspect Data Lab, ledet af Evangelos E. Papalexakis, adjunkt ved afdelingen for datalogi og teknik, udvikler nye datavidenskabelige teknikker til at løse en række problemer i sociale netværksanalyse, med finansiering fra Naval Sea Systems Command, Naval Engineering Education Consortium, National Science Foundation, og Adobe.

Forskerne bygger algoritmer til at skelne mønstre, der indikerer "falske nyheder". Gennem ekstrapolering, og kommandoer indsat i udgivernes indholdsstyringssystemer, disse genstande kan derefter fjernes, før de går live og forårsager kaos. Afgørende, UCR-beregningen kan registrere "fodaftrykket" af sådanne stillinger for at understøtte retsforfølgning.

Papalexakis' seneste akademiske papir om dette arbejde:"Usupervised Content-Based Identification of Fake News Articles with Tensor Decomposition Ensembles, "samskrevet med kandidatforsker Seyed Mehdi Hosseini Motlagh, blev præsenteret, og vandt prisen for bedste papir, " på det nylige MIS2:Misinformation and Misbehavior Mining on the Web workshop, del af WSDM 2018 (11. ACM International Conference on Web Search and Data Mining).

"Tidligere undersøgelser har givet nyttig indsigt i udbredelsen af ​​en artikel i et socialt netværk. Detektion, der udelukkende er baseret på dette, udgør en risiko for, at en falsk nyhedsartikel 'inficerer' en række brugere af sociale medier, før den opdages, " sagde Papalexakis. "I stedet, vores arbejde sigter mod tidlig opdagelse af sådanne artikler, især i tilfælde, hvor vi ikke har nogen ekstern viden om gyldigheden og rigtigheden af ​​en artikel."

Menneskelig netværksovervågning er afhængig af en kombination af sund fornuft og erfaring for at vide, om noget er legitimt. For eksempel, moderatorer tjekker, om overskriften er skrevet med STORE BOGSTAVER (digital-kulturkode for "råb"), bruge velkendte hadforbrydelser sprog søgeord, og se efter en mangel på verificerede kilder til falske påstande.

Men hvordan lærer man en computer, at disse triangulerede attributter ofte indikerer "falske nyheder"?

Maskinbaseret forståelse er udelukkende baseret på matematiske begreber, så Papalexakis og hans forskere bruger det, der kaldes "Multi-Aspect Data." Kort fortalt, forestil dig en social gruppering, hvor alle i interaktionen har mange måder at forbinde (f.eks. telefon, tekst, video, direkte besked, opslag på sociale medier). Multi-Aspect Data Lab registrerer derefter, undersøger, kategoriserer og modellerer alle disse input, baseret på det, der er kendt som "tensor-nedbrydninger." En "tensor" i datavidenskab betyder en multidimensionel struktur, som en terning. Alle multi-aspekterne er digitalt fanget som multidimensionelle kuber, så systemet kan undersøge og "forstå", hvad der virkelig foregår - og om nyheden er falsk, eller ikke.

"Tensornedbrydningsteknikkerne, vi udvikler, er i stand til at fange nuancerede mønstre, der med succes identificerer forskellige kategorier af falske nyheder, uden at bruge nogen ekstern viden om gyldigheden af ​​en bestemt artikel." sagde Papalexakis.

Ved at udnytte mangfoldigheden af ​​alle dataaspekter, UCR-systemet giver et mere præcist resultat end tidligere offentliggjort forskning på dette område. I deres papir, forfatterne illustrerer, hvordan de kompilerer deres algoritme, publicer derefter resultaterne af flere eksperimenter, demonstrerer, at den foreslåede algoritme identificerede op til 80 procent af falske nyheder.

Industrien har taget til efterretning. Papalexakis sagde, at han aktivt forfølger samarbejder med store teknologigiganter.


Varme artikler