Videnskab
 science >> Videnskab >  >> Elektronik

Søgning gennem støj efter fordele og ulemper

Kredit:CC0 Public Domain

Struktureret beslutningsstøtte:Forskningsprojektet "ArgumenText" inden for Ubiquitous Knowledge Processing har fundet en måde at filtrere konkrete pro og con argumenter om ethvert emne blandt internettets støj.

Googling efter søgeudtrykket "Atomenergi" på internettet giver cirka 268 millioner hits:Forklaringer, definitioner, lobbyvirksomhedstekster, avisartikler, anekdoter, konspirationsteorier. Hvordan kan nogen, for eksempel en investor, søger reelle fordele og ulemper vedrørende atomkraft som en beslutningsstøtte, finde det de leder efter? Projektet "ArgumenText" inden for Fachgebiet Ubiquitous Knowledge Processing (UKP) fra Institut for Datalogi ved TU Darmstadt har til formål at filtrere konkrete argumenter fra omfangsrige og heterogene tekstmasser.

For nylig, en demo af søgesystemet kom på banen, som allerede har bevist sit værd på messer. For eksempel, enhver, der forsker i emnet "Atomenergi" vil, efter et par sekunder, se lige under hundrede argumenter for og imod atomkraft - fra en række forskellige internetsider. Jo bedre CO 2 balance og effektiviteten ved atomenergiproduktion er angivet her, sammen med de anvendte stoffers toksicitet og farlige karakter og de lange perioder, hvor det udsender radioaktivt affald i deres omgivelser. De respektive kilder er knyttet sammen.

Til dette formål, tekster, der er tilgængelige på internettet, undersøges ved hjælp af neurale netværk, klassificeret som relevant eller ikke relevant for søgeemnet, og derefter tappede for argumenter. "Der søges ikke kun individuelle ord, men grammatiske strukturer, kontekster og semantik undersøges for at afgøre, om et udsagn er et 'argument' eller ej, og om det er på fordel eller imod, "forklarer Dr. Johannes Daxenberger, der arbejder i teamet af professor Iryna Gurevych som en af ​​de to projektledere på ArgumenText.

Algoritmerne bag ArgumenText er under udvikling af teamet i selve feltet, bygger på indledende eksperimenter, der startede i 2014 med et antal studerende essays. "Udfordringen var at gøre et system, der er uddannet i en bestemt teksttype, overførbart til enhver form for tekst, "siger anden projektleder Dr. Christian Stab." Argumentation i videnskabelige tekster, for eksempel, er helt anderledes end i sociale medier. "Teamet operationaliserede forskellige modeller for argumentationsteori og lærte edb -systemer at bruge disse modeller. For at optimere algoritmerne, holdet ansat i et stærkt computernetværk; en mindre, mere kraftfuldt computernetværk, der effektivt kan indeksere internetbaserede tekster, bruges nu til løbende drift.

Offentlig demonstrator

Demonstranten er stabil og er for nylig blevet offentligt tilgængelig. Projektet går således ind i den næste fase, som specifikt vil teste, hvilke applikationer der er særligt lovende for den nye teknologi. De vigtigste målgrupper er beslutningstagere fra erhvervslivet, der skal vurdere, om brugen af ​​en innovation kan betale sig, og journalister, der hurtigt og pålideligt skal finde vej til kernen i et emne inden for rammerne af en søgning, siger Daxenberger. "Vi tror, ​​at systemet kunne bruges rentabelt på disse områder."

Til validering, de deltagende forskere forbereder i øjeblikket også metoden til brug med tysksprogede tekster. Nu, ArgumenText taler kun engelsk, arbejder med et tekstkorpus fra år 2016 og fungerer bedst med tekniske forespørgsler. Dette vil snart ændre sig. Det vil også være muligt at søge i realtid i det stadigt voksende antal tekster på internettet.

I øjeblikket, algoritmen sorterer udsagn efter, hvor pålideligt de kan tjene som argumenter. Forskere arbejder for sammenlægning af argumenterne mod brugere, præsentere dem efter temaer. "Dette er indlysende fra et applikationsperspektiv, men bestemt ikke trivielt set fra et teknisk synspunkt, "siger Stab. Argument mining, anerkendelse af sproglige argumenter ved hjælp af datalogi bliver stadig vigtigere og mere synlig, siger Daxenberger og Stab, i forskningen inden for Digital Humanities. TU var tidligt aktiv på dette område. "Vores arbejdsgruppe har godt og synligt etableret TU inden for argumentminedrift, "siger professor Iryna Gurevych, chef for UKP. Til dette formål, det tværfaglige team arbejder med TU Institut for Sociale og Historiske Videnskaber, samt med andre universiteter fra netværket af Rhinen-Main universiteter.


Varme artikler