Visualisering ved hjælp af HyperTools til at repræsentere indholdet af Wikipedia-artikler. Hver prik repræsenterer en enkelt Wikipedia-artikel (fra et sæt af 3, 000 tilfældigt udvalgte artikler). Prikpositionerne afspejler, hvad artiklerne handler om (nærliggende prikker handler om lignende emner), og prikfarverne afspejler automatisk opdagede "klynger" af artikler, der handler om lignende temaer. Kredit:Statisk billede af Contextual Dynamics Laboratory, Dartmouth College
Hvert datasæt i det observerbare univers har en grundlæggende geometri eller form, men den struktur kan være meget kompliceret. For at gøre det nemmere at visualisere komplicerede datasæt, et forskerhold fra Dartmouth har skabt HyperTools – en open source-softwarepakke, der udnytter en række matematiske teknikker til at opnå intuitioner om højdimensionelle datasæt gennem de underliggende geometriske strukturer, de afspejler. Resultaterne er offentliggjort i Journal of Machine Learning Research .
HyperTools kan bruges til at transformere data til visualiserbare former eller animationer, som kan bruges til at:sammenligne forskellige datasæt, få indsigt i underliggende mønstre på en intuitiv måde, foretage generaliseringer på tværs af datasæt, og udvikle og teste teorier vedrørende Big Data.
"De datasæt, vi står over for som moderne videnskabsmænd, kan være enormt komplekse, ofte afspejler mange interagerende komponenter, " forklarer senior forfatter, Jeremy R. Manning, en assisterende professor i psykologi og hjernevidenskab og direktør for Contextual Dynamics Lab i Dartmouth. "Vores værktøj forvandler komplekse data til intuitive 3D-former, der visuelt kan undersøges og sammenlignes. vi udnytter det visuelle systems fantastiske evne til at finde mønstre i verden omkring os til også at finde mønstre i komplekse videnskabelige data."
Forskerne demonstrerer, hvordan HyperTools kan anvendes på forskellige typer data. I avisen, de viser visualiseringer af:hjerneaktivitet, filmframes og hjernereaktioner på at se disse frames; ændringer i temperaturmålinger over Jordens overflade fra 1875 til 2013; og det tematiske indhold af politiske tweets udstedt af Hillary Clinton og Donald Trump under den amerikanske præsidentkampagne i 2016.
HyperTools genererede visualisering af skiftende temperaturer på tværs af Jordens overflade fra 1875-2013. Visualisering fremhæver den cykliske (sæsonmæssige) karakter af globale temperaturer, der opstår sammen med en gradvis stigning i globale temperaturer over tid. Billedet er blandt dem, der er inkluderet i figur 1 i tidsskriftsartiklen. Kredit:Statisk billede af Contextual Dynamics Laboratory, Dartmouth College.
Ud over at bruge HyperTools til direkte at forstå den geometriske struktur af data, den indsigt, som værktøjet afslører, kan også bruges til at guide udviklingen af maskinlæringsalgoritmer. For eksempel, datavisualiseringerne kan afsløre, hvordan forskellige typer observationer danner strukturerede distinkte klynger (f.eks. Trump-tweets vs. Clinton-tweets), der kunne bruges til at forstå lighederne og forskellene mellem grupper.
Som en del af HyperTools værktøjskassen, Mannings laboratorium fortsætter med at udvikle og frigive andre typer geometriske visualiseringsanalyser, herunder de nyligt lancerede tekstanalyser.
Visualisering ved hjælp af HyperTools til at repræsentere indholdet af tidsskriftsartikler. Hver prik repræsenterer et enkelt papir udgivet i Neural Information Processing Systems (NIPS). Prikpositionerne afspejler, hvad papirerne handler om (nærliggende prikker handler om lignende emner), og prikfarverne afspejler automatisk opdagede "klynger" af papirer, der handler om lignende temaer. Kredit:Contextual Dynamics Laboratory, Dartmouth College.
3-D-animation af en visualisering ved hjælp af HyperTools til at repræsentere indholdet af Wikipedia-artikler. Kredit:Contextual Dynamics Laboratory, Dartmouth College