Videnskab
 science >> Videnskab >  >> Elektronik

En dyb læringsbaseret metode til at opdage cybermobning på Twitter

Systemets arkitektur. Kredit:Al-Ajlan &Ykhlef.

Forskere ved King Saud University, i Saudi-Arabien, har udviklet en ny tilgang til at opdage cybermobning på Twitter ved hjælp af deep learning kaldet OCDD. I modsætning til andre dyb læringstilgange, som udtrækker funktioner fra tweets og leverer dem til en klassificering, deres metode repræsenterer et tweet som et sæt ordvektorer.

I de seneste år, cybermobning på sociale medier er blevet et stort og meget diskuteret emne. Cybermobning indebærer brug af online kommunikationskanaler til at mobbe andre brugere ved at sende intimiderende, truende eller krænkende beskeder. Dette kan have psykiske og nogle gange livstruende konsekvenser for ofrene.

Forskere verden over har forsøgt at udvikle nye måder at opdage cybermobning på, administrere det og reducere dets udbredelse på sociale medier. Mange deep learning-tilgange til at identificere cybermobning fungerer ved at analysere tekst- og brugerfunktioner. Imidlertid, disse teknikker har flere begrænsninger, hvilket kan reducere deres ydeevne betydeligt.

For eksempel, nogle af disse tilgange forsøger at forbedre detektionen ved at introducere nye funktioner. Alligevel kan en forøgelse af antallet af funktioner komplicere faseudvindingen og udvælgelsen af ​​funktioner. I øvrigt, disse tilgange mener ikke, at nogle brugerdata, såsom alder og fødselsdato, let kan fremstilles. For at imødegå begrænsningerne ved eksisterende metoder til afsløring af cybermobning, Monirah A. Al-Ajlan og Mourad Ykhlef, to forskere ved King Saud University, foreslået en ny tilgang kaldet optimeret Twitter cybermobning detection (OCDD).

"I modsætning til tidligere arbejde på dette felt, OCDD udtrækker ikke funktioner fra tweets og leverer dem til en klassificering:Snarere, det repræsenterer et tweet som et sæt ordvektorer, " forklarer forskerne i deres papir, offentliggjort på IEEE Explore og præsenteret den 21 st Saudi Computer Society National Computer Conference (NCC). "På denne måde ords semantik er bevaret, og faseudtræk og valg af funktioner kan elimineres."

Al-Ajlan og Ykhlef byggede deres tilgang på mærkede træningsdata og genererede ordindlejringer for individuelle ord ved hjælp af GloVe, en uovervåget indlæringsalgoritme, der kan opnå vektorrepræsentationer for ord. Disse ordindlejringer føres derefter til et konvolutionelt neuralt netværk (CNN) for at opdage, om de kan være forbundet med cybermobning.

CNN-algoritmer består typisk af et input- og outputlag, samt flere andre lag. Manuel indstilling af parametre for hvert af disse lag kan være en tidskrævende og udfordrende opgave. Forskerne besluttede derfor at inkorporere en metaheuristisk optimeringsalgoritme i deres model, som kan lette denne proces ved at identificere optimale eller næsten optimale værdier, der skal bruges til klassificering.

"OCDD fremmer den nuværende tilstand af afsløring af cybermobning ved at eliminere den svære opgave at udtrække/udvælge funktioner og erstatte den med ordvektorer, der fanger ords semantik, og CNN, som klassificerer tweets på en mere intelligent måde end traditionelle klassifikationsalgoritmer, " skriver forskerne i deres papir.

Når testet på tekstmining-opgaver, OCDD opnåede meget lovende resultater. Imidlertid, det mangler endnu at blive implementeret og evalueret inden for afsløring af cybermobning. Forskerne planlægger nu at tilpasse deres tilgang, så den også kan analysere tekst på arabisk.

© 2019 Science X Network




Varme artikler