Videnskab
 science >> Videnskab >  >> Elektronik

Hadetal modvirkes ved at opdage, fremhæve hjælpetale

Denne word cloud skildrer svar på sociale medier på spørgsmålet om, hvor Rohingya -flygtninge skal hen. Kredit:Carnegie Mellon University

Fuldfør følgende sætning:Rohingya-flygtninge bør gå til ... —

A. Pakistan.
B. Bangladesh.
C. Helvede.

Det er ikke gode valg, men alle er følelser, der er blevet udtrykt gentagne gange på sociale medier. Rohingyaerne, der begyndte at flygte fra Myanamar i 2017 for at undgå etnisk udrensning, er dårligt rustet til at forsvare sig mod disse online angreb, men innovationer fra Carnegie Mellon University's Language Technologies Institute (LTI) kunne hjælpe med at imødegå den hadefulde ytringer rettet mod dem og andre stemmeløse grupper.

LTI-forskerne har udviklet et system, der udnytter kunstig intelligens til hurtigt at analysere hundredtusindvis af kommentarer på sociale medier og identificere den fraktion, der forsvarer eller sympatiserer med fravalgte minoriteter såsom rohingya-samfundet. Menneskelige moderatorer på sociale medier, som umuligt kunne gennemskue så mange kommentarer manuelt, ville så have mulighed for at fremhæve denne "hjælpetale" i kommentarsektioner.

"Selv om der er masser af hadefuldt indhold, vi kan stadig finde positive kommentarer, "sagde Ashiqur R. KhudaBukhsh, en post-doc forsker i LTI, der udførte forskningen med alumnus Shriphani Palakodety. At finde og fremhæve disse positive kommentarer, de foreslår, kan gøre lige så meget for at gøre internettet mere sikkert, sundere sted, ligesom opdagelse og eliminering af fjendtligt indhold eller forbud mod de ansvarlige trolde.

Overladt til sig selv, Rohingyaerne er stort set forsvarsløse over for hadefulde ytringer på nettet. Mange af dem har begrænsede færdigheder i globale sprog som engelsk, og de har ringe adgang til internettet. De fleste har for travlt med at holde sig i live til at bruge meget tid på at sende deres eget indhold, sagde KhudaBukhsh.

For at finde relevant hjælpetale, forskerne brugte deres teknik til at søge efter mere end en kvart million kommentarer fra YouTube i, hvad de mener er den første AI-fokuserede analyse af Rohingya-flygtningekrisen. De vil præsentere deres resultater på Association for the Advancement of Artificial Intelligence årlige konference, 7.-12. Februar kl. i New York City.

Tilsvarende i en endnu ikke offentliggjort undersøgelse, de brugte teknologien til at søge efter antikrigs "håb-tale" blandt næsten en million YouTube-kommentarer omkring Pulwama-terrorangrebet i Kashmir i februar 2019, som flammede den mangeårige konflikt mellem Indien og Pakistan om regionen.

Evnen til at analysere så store mængder tekst for indhold og mening er mulig på grund af de seneste store forbedringer i sprogmodeller, sagde Jaime Carbonell, LTI-direktør og medforfatter på undersøgelsen. Disse modeller lærer af eksempler, så de kan forudsige, hvilke ord der sandsynligvis vil forekomme i en given sekvens og hjælpe maskiner med at forstå, hvad talere og forfattere forsøger at sige.

Men CMU -forskerne udviklede en yderligere innovation, der gjorde det muligt at anvende disse modeller på korte tekster på sociale medier i Sydasien, han tilføjede. Korte stykker tekst, ofte med stave- og grammatikfejl, er svære for maskiner at fortolke. Det er endnu sværere i de sydasiatiske lande, hvor folk kan tale flere sprog og har tendens til at "kodeskifte, " ved at kombinere stykker af forskellige sprog og endda forskellige skrivesystemer i samme erklæring.

Eksisterende maskinlæringsmetoder skaber repræsentationer af ord, eller ordindlejringer, så alle ord med en lignende betydning er repræsenteret på samme måde. Denne teknik gør det muligt at beregne nærheden af ​​et ord til andre i en kommentar eller et indlæg. For at udvide denne teknik til de udfordrende tekster i Sydasien, CMU-teamet fik nye indlejringer, der afslørede sproggrupperinger eller klynger. Denne sprogidentifikationsteknik fungerede lige så godt eller bedre end kommercielt tilgængelige løsninger.

Denne innovation er blevet en mulig teknologi til beregningsmæssige analyser af sociale medier i den pågældende region, Noterede Carbonell.

Prøver af YouTube -kommentarerne viste, at omkring 10% af kommentarerne var positive. Da forskerne brugte deres metode til at søge efter hjælpetale i det større datasæt, resultaterne var 88 % positive, angiver, at metoden væsentligt kan reducere den manuelle indsats, der er nødvendig for at finde dem, sagde KhudaBukhsh.

"Intet land er for lille til at tage imod flygtninge, " sagde en tekst, mens en anden argumenterede "alle lande burde tage stilling til disse mennesker."

Men at opdage pro-rohingya-tekster kan være et tveægget sværd:nogle tekster kan indeholde sprog, der kunne betragtes som hadefulde ytringer mod deres påståede forfølgere, han tilføjede.

Rohingya -antagonister er "virkelig ligesom dyr ikke som mennesker, så derfor folkedraber de uskyldige mennesker, " sagde en sådan tekst. Selvom metoden reducerer den manuelle indsats, kommentarer som denne indikerer det fortsatte behov for menneskelig dømmekraft og for yderligere forskning, konkluderede forskerne.


Varme artikler