Kredit:CC0 Public Domain
Den allestedsnærværende og store mængde af data, der genereres i dag, giver eksperter inden for stort set alle domæner rigelig information til at spore alt fra finansielle tendenser, katastrofe evakueringsruter, og gadetrafik, til dyrevandringer, vejrmønstre, og sygdomsvektorer. Men at bruge disse data til at opbygge visualiseringer af komplekse prædiktive modeller ved hjælp af maskinlæring er en udfordring for eksperter, der mangler de nødvendige computervidenskabelige færdigheder.
Et team på NYU Tandon School of Engineerings Visualization and Data Analytics (VIDA) laboratorium, ledet af Claudio Silva, professor ved afdelingen for datalogi og teknik, udviklet en ramme kaldet VisFlow, hvorved de, der måske ikke er eksperter i maskinlæring, kan skabe meget fleksible datavisualiseringer fra næsten alle data. Desuden, holdet gjorde det nemmere og mere intuitivt at redigere disse modeller ved at udvikle en udvidelse af VisFlow kaldet FlowSense, som giver brugerne mulighed for at syntetisere dataudforskningspipelines gennem en naturlig sproggrænseflade.
Forskningen, "FlowSense:A Natural Language Interface for Visual Data Exploration with a Dataflow System" vandt prisen for bedste papir på dette års IEEE Conference on Visual Analytics Science and Technology (VAST).
På tirsdag, 22. oktober, Bowen Yu, som modtog sin doktorgrad ved NYU Tandon under Silva, vil præsentere papiret ved åbningen af plenarmødet for IEEE Visualization Conference (IEEE VIS) i Vancouver, Britisk Columbia. Undersøgelsen er en af flere artikler, der fokuserer på VIDA-forskning, som vil blive præsenteret på IEEE VIS, det førende mødested for visualiseringsforskning og en førende konference for computergrafik.
På konferencen, samarbejdspartnere med VIDA, som har etableret sig som et førende forskningscenter for datavisualisering, vil præsentere visualiseringsmodelleringsprojekter med applikationer inden for astronomi, medicin, og klimaforskning udviklet på eller med centret:
VisFlow, introduceret i 2017 og delvist finansieret af Defence Advanced Research Projects Agency's Data Driven Discovery of Models-program er en webbaseret ramme, der giver brugeren mulighed for at bruge simple træk-og-slip-handlinger til nemt at interagere med data, lader brugere skabe visuelle datamodeller baseret på tidsserier, netværk, geografiske placeringer, og mere, som alle kan formes til et kompakt og interaktivt visualiseringsdashboard.
Yu sagde, at FlowSense tager disse muligheder et skridt videre. "Forestil dig, hvis man blot kunne tale eller skrive en sætning for at aktivere et dataflowdiagram, " sagde han. "Denne egenskab ville gøre ikke-eksperter mere komfortable brugere, samtidig med at erfarne brugere får genveje. Vi tror på, at vi med naturlig sprogunderstøttelse kan mindske indlæringskurven for et system som dette og gøre dataflow mere tilgængeligt," sagde han.
Silva, en IEEE Fellow, der er tilknyttet NYU's Courant Institute for Mathematical Sciences, Center for Datavidenskab, Center for Byvidenskab og Fremskridt, og Center for Avanceret Teknologi i Telekommunikation, tilføjet, "Vi tilbyder VisFlow og FlowSense som open source, gratis-til-alle kodebaserede rammer på github, som en måde at motivere til videre udvikling i visualiseringsøjemed. Der er virkelig meget mere forskning, der kunne gøres på dette område, og det er mit håb, at FlowSense vil være en væsentlig stimulans for mere samarbejde om at gøre dataflowsystemer mere fleksible, let at bruge, og populær blandt dataanalytikere."