Videnskab
 science >> Videnskab >  >> Andet

Algoritmer er ikke så gode til at identificere voksenindhold

Det er ikke svært at forestille sig en botflaggende kunstner Georgia O'Keeffes ikoniske maleri "Grå linjer med sort, Blå og gul "(afbilledet her på Tate Modern) som voksenindhold. Rob Stothard/Getty Images

Platformen Tumblr har besluttet ikke længere at tillade voksenindhold. Forbuddet træder i kraft 17. december kl. 2018, og for at håndhæve det, Tumblr ser ud til at have implementeret en bot, der er enestående dårlig til sit job, markerer uskyldigt indhold som pornografisk i naturen og får både brugere og tekniske videnskabsfolk til at undre sig over, hvorfor boten er så dårlig til, hvad den gør. En del af svaret er, at mådehold med kunstig intelligens er en ekstremt vanskelig opgave.

Mange af de finesser, der er involveret i at beslutte, hvilket indhold vi finder acceptabelt eller stødende, skal skrives ned i sten, og vores track record med at gøre det er ikke så fantastisk. Faktisk, vi har problemer med at identificere noget som pornografisk i første omgang. Den afdøde amerikanske højesteretsdommer Potter Stewart opsummerede stemningen i en kendelse om en uanstændighedssag (Jacobellis v. Ohio) med sætningen "Jeg ved det, når jeg ser det."

Denne følelse har vist sig at være så vag i praksis, som den er i betydning. Her er et eksempel:Et billede af en mand med erektion skal være fræk i naturen, ret? Men hvad nu hvis dette er for en medicinsk illustration af priapisme, en ofte smertefuld tilstand, der forårsager en langvarig erektion, og det vises på et medicinsk sted? Hvis en repræsentation af en vulva er uanstændig, betyder det værket af kunstneren Georgia O'Keeffe, hvis blomstermalerier ofte menes at være visuelle metaforer for kvindelig anatomi, skal markeres i kunsthistoriske artikler?

Sociale netværk og indholdsplatforme støder på disse situationer hele tiden. For eksempel, i en større PR -hændelse i 2016, Facebook censurerede Pulitzer-prisvindende foto af en nøgen 9-årig Kim Phuc, der løb i terror fra et napalmangreb under Vietnamkrigen; billedet blev udgivet af Norges mest fremtrædende avis for en relevant artikel om krigsførelse. Derimod, Twitter-brugere kunne ikke overtale platformen til at lukke nynazistiske konti indtil udgangen af ​​2017. Med forskellige filosofier og tilsyneladende vilkårlig, kontekstfrie regler, der kan forvirre selv menneskelige moderatorer, Det er ikke underligt, at algoritmer har problemer med at finde ud af, hvad de skal markere.

Tumblrs system ser ud til at lede efter en mængde af det, det ser som udsat hud i billeder, eller former, den mener kan være brystvorter eller kønsorganer. Desværre, en masse godartede nærbilleder på ikke-erogene dele af menneskekroppen overskrider tærsklen for, hvor meget bart kød et billede viser, som Dan Fallon skrev til Digg bemærkede. Visse genstande som træer kunne også se falsk ud. Og i et tilsyneladende uforklarligt tilfælde, Fallon skrev, en landskabsfotografs meget uskyldige naturbilleder blev markeret som problematiske, også. Det her, imidlertid, er ikke usædvanligt for sådanne algoritmer. Andre iterationer af censor-bots har markeret billeder af klitter og strande, fordi sandets farve lignede hudfarven i henhold til deres træningsdatasæt.

Denne systematiske fejl giver også mening, når man overvejer, hvor mange hudtoner mennesker har. Farver fra en lys beige til næsten sort forekommer alle naturligt, og afhængigt af hvordan en AI trænes eller en sensor kalibreres, det forstår måske ikke, at der overhovedet findes mørkere hudfarver. Som resultat, en algoritme, der er uddannet til at få øje på og censurere pornografiske billeder med kaukasiske kunstnere, er muligvis ikke i stand til at markere lige eksplicitte billeder med mørkhudede modeller. En af de lette løsninger til det er at overkompensere, markere alt og retfærdiggøre de falske positiver som værende bedre end ikke at fange nok voksenindhold, hvilket er, hvad Tumblr ser ud til at have gjort i kampen om at rense sit indhold. Tumblr returnerede ikke anmodninger om kommentarer om, hvorvidt der var et ekstra lag til dets moderering.

Ultimativt, det er tilbage at se, om en overivrig censuralgoritme også driver brugere, der ikke sender voksenindhold fra platformen. eller om det vil blive ringet op. Men Tumblrs meget offentlige og aggressive overflagning fremhæver nogle af de mange vanskeligheder ved at moderere onlinemedier. Så fejl vil fortsat blive begået, og laves ofte. Indtil vi kan finde ud af at håndtere disse bekymringer, mennesker bliver nødt til at føre tilsyn med enhver virkelig vellykket mådeholdelsesindsats.

Nu er det interessant

Selv grouchy Garfield blev forbudt fra Tumblr i den første fejning, som mange artikler bemærkede.