Videnskab
 Science >> Videnskab >  >> Solformørkelse

Hvordan vi byggede et værktøj, der opdager styrken af ​​islamofobisk hadefuld tale på Twitter

Udfordringen

Islamofobi er et alvorligt problem, der rammer millioner af mennesker rundt om i verden. I de seneste år har der været en stigning i islamofobiske hadefulde ytringer online, især på sociale medieplatforme som Twitter. Denne hadefulde ytring kan have en ødelæggende indvirkning på muslimske individers og samfunds mentale sundhed og sikkerhed.

En af udfordringerne ved at bekæmpe islamofobisk hadefuld tale er, at det kan være svært at identificere. Der er ikke en enkelt definition af islamofobi, og den måde, den kommer til udtryk på, kan variere fra person til person. Dette gør det vanskeligt for automatiserede værktøjer at opdage islamofobisk hadefuld tale med en høj grad af nøjagtighed.

Vores tilgang

For at løse denne udfordring har vi udviklet et værktøj, der bruger en kombination af naturlig sprogbehandling (NLP) og maskinlæringsteknikker til at opdage styrken af ​​islamofobisk hadefuld tale på Twitter. Vores værktøj er baseret på et datasæt med over 10.000 tweets, der blev manuelt kommenteret af eksperter inden for islamofobi.

Værktøjet fungerer ved først at udtrække et sæt funktioner fra hvert tweet, såsom hyppigheden af ​​bestemte søgeord, tilstedeværelsen af ​​hadefulde ytringer og følelsen af ​​tweetet. Disse funktioner bruges derefter til at træne en maskinlæringsmodel, der kan forudsige styrken af ​​islamofobisk hadefuld tale på Twitter.

Modellen trænes ved hjælp af en superviseret læringstilgang, hvilket betyder, at den er forsynet med et sæt mærkede data (dvs. tweets, der manuelt er blevet annoteret som islamofobiske eller ej) og lærer at identificere de funktioner, der er mest indikative for islamofobi. Når først modellen er trænet, kan den bruges til at forudsige styrken af ​​islamofobisk hadefuld tale på nye tweets.

Evaluering

Vi evaluerede vores værktøjs ydeevne ved hjælp af et holdout-testsæt af tweets. Værktøjet opnåede en nøjagtighed på 85 % i identifikation af islamofobisk hadefuld tale, hvilket er væsentligt højere end præstationerne af baseline-metoder.

Påvirkning

Vores værktøj er blevet brugt til at identificere og fjerne tusindvis af islamofobiske hadtale tweets fra Twitter. Dette har været med til at skabe et mere sikkert miljø for muslimske brugere på platformen og har bidraget til kampen mod islamofobi online.

Konklusion

Vi mener, at vores værktøj er en værdifuld ressource til at bekæmpe islamofobisk hadefuld tale på Twitter. Værktøjet er præcist og effektivt, og det kan bruges til at identificere og fjerne hadefulde tweets i realtid. Vi håber, at vores værktøj vil være med til at gøre Twitter til et mere sikkert sted for muslimske brugere og vil bidrage til kampen mod islamofobi online.