2018 Dawn or Doom-konferencen byder på foredrag af mere end tre dusin Purdue-fakultetsmedlemmer og nationale eksperter, der repræsenterer fire områder - Maskiner:kunstig intelligens, robotteknologi, autonome køretøjer og droner; Mind:internet og sociale medier effekter; Krop:bioteknik og menneskelig design; og Data:Internet of Things, privatliv og cybersikkerhed. Kredit:Purdue University
"Jeg føler mig syg." "Dette videospil er SYGT!" Til en computer, ordet "syg" kan have samme betydning i disse to sætninger.
Men en Purdue-professor kombinerer maskinlæring med modeller for sociale relationer og adfærd for at læse mellem tekstlinjerne og fange forfatterens hensigt på en dybere måde. Teknologien kan hjælpe med at identificere skævheder i opslag på sociale medier og nyhedsartikler, jo bedre at bedømme oplysningernes gyldighed.
Traditionel behandling af naturligt sprog involverer søgeord – f.eks. ordet "god" vil normalt angive en positiv udtalelse. Dette fungerer godt til visse applikationer, men det er ikke nyttigt, når teksten er tvetydig, f.eks. hvis forfatteren havde til hensigt at et ord eller en sætning skulle være sarkastisk eller sarkastisk.
Det er her Purdue-professor Dan Goldwassers tilgang kommer ind i billedet. Han fokuserer især på aktuelle begivenheder og politiske spørgsmål, og analyserer nyhedsartikler og politikeres tweets for at forsøge at fastslå, hvordan forfatteren rammer bestemte emner, og hvad deres ideologi er.
Goldwasser, en adjunkt i datalogi, vil tale om dette arbejde på Dawn or Doom '18, Purdues årlige konference om risici og fordele ved nye teknologier. Dawn or Doom vil blive afholdt på Purdues West Lafayette campus mandag og tirsdag (5.-6. november). Konferencen, nu på sit femte år, er gratis og åbent for offentligheden.
Dawn or Doom er tilpasset Purdues Giant Leaps Sesquicentennial Campaign og er en del af Ideas Festival-temaet, Kæmpespring inden for kunstig intelligens, Algoritmer, og automatisering:balance mellem menneskehed og teknologi. Idéfestivalen er kampagnens midtpunkt og forbinder verdenskendte talere og Purdue-ekspertise i en samtale om de mest kritiske problemer og muligheder, som verden står over for.
I et projekt, Goldwasser analyserer Twitter-opslag fra politiske embedsmænd. Tweets kan være en udfordrende form for tekst at fortolke, fordi de er korte og kan være tvetydige. Som et eksempel, efter et masseskyderi, udtrykket "tanker og bønner" kan bruges oprigtigt til at udtrykke sympati for ofrenes familier, men det kan også bruges sarkastisk som en kritik af manglen på regeringens handling på våbenkontrol.
Goldwasser og hans team forsøger at forstå, hvordan politikere rammer emner eller begivenheder, og hvordan den ramme belyser deres holdning til spørgsmålet. At gøre dette, han kombinerer sproglig analyse med modellering af sociale relationer og adfærd. Sociale netværk kan give indsigt i tekstens betydning, fordi hvis to mennesker er tæt forbundet, de vil sandsynligvis dele lignende ideologier. Opførsel, som når en person poster på sociale medier, kan forudsige, hvilke problemer de bekymrer sig om. Kombinationen af alle tre modeller giver et mere komplet billede af forfatterens hensigt end at stole på nogen af dem alene.
I et andet projekt, finansieret af Google, Goldwasser bruger sociale relationsmodeller til at forsøge at identificere bias i nyhedskilder. Nøgleord kan være en god måde at differentiere ideologi for et lille sæt data. For eksempel, en artikel om et masseskyderi, der fokuserer på skyttens mentale sundhed, er mere tilbøjelige til at have et konservativt synspunkt, hvorimod en artikel, der diskuterer, hvordan pistolen blev opnået, er mere tilbøjelig til at have et liberalt syn.
"Problemet er, at det er svært at opskalere manuelt at identificere de relevante indikatorer for hver begivenhed, " siger Goldwasser.
I stedet, hans team samler flere nyhedsartikler om den samme begivenhed og opbygger et netværk af mennesker, der deler artiklerne på sociale medier. Baseret på netværkets tilknytning til enkeltpersoner eller organisationer med en kendt politisk vinkling, artiklens perspektiv kan udledes uden at skulle generere relevante søgeord manuelt.