Kredit:CC0 Public Domain
Et team af dataloger ved USC Viterbi School of Engineering satte sig for at udvikle nye værktøjer til at automatisere og organisere samfundsvidenskabelige data. Hvad brugte de som deres datasæt? Twitter-opslag fra kysthovedstæderne, New York City og Los Angeles.
Forskerne fandt ud af, at de kunne identificere lignende tweets, der ikke har hashtags, ved at bruge naturlig sprogbehandling og neurale netværk til at skabe klynger af ens tweets. "Det bruger kunstig intelligens til at skabe et kort over lignende tweets, " siger Mayank Kejriwal, en forskningsassistent professor i USC Department of Industrial and Systems Engineering, og en forskningsleder ved USC Information Sciences Institute, som er ekspert i vidensgrafer.
Det nye værktøj tager tweets og konverterer dem til en matematisk vektor ved hjælp af et neuralt netværk, giver dig mulighed for at se, om to punkter ligner hinanden. Dermed, du kan se klynger af relaterede indlæg. For eksempel, AI er i stand til at fortælle, hvis tweets såsom "Lounging on the beach, tænker på mit liv" og "I dag er det surfing, solbadning og mindfulness" er meget ens, selvom de næsten ikke har ord til fælles.
Ved at sammenligne Angelenos med New Yorkere, de fandt nogle interessante trendindlæg.
Nej. Angelenos talte ikke om de 405 mere, end NYere talte om LØGNEN. Og ingen af grupperne talte om fast ejendom som et stort emne.
Den øverste klynge af tweets i LA? Omkring emnet 'job'.
Der er ofte en opfattelse af, at LA er forgæves. New York City og New York er blandt de fem bedste ting, newyorkere tweeter om.
Hvad med kunst? Kunst synes at dominere samtalen for Los Angeles mere end i New York. Men opdel efter befolkning, og den gennemsnitlige New Yorker viser sig at være mere kunstnerisk.
I modsætning til den gængse opfattelse, online, Angelenos havde en tendens til at tale om sundhedspleje og ikke om velvære.
New York, dataprøven afslører, kan faktisk, være "Byen der aldrig sover", som forskerne siger, at dens indbyggere bliver levende om natten. men Angelenos, tro eller ej, har større mund – de poster mere på sociale medier. I åbningstiden, Angelenos har en tendens til at sende mellem 30-60 % flere tweets end newyorkere. Efter kl. 20.00 der er ingen forskel på de to.
I både LA og New York, områder med højere indkomst tweeter mere.
Datasættet blev udtaget fra oktober 2016. Forskningen blev dokumenteret i Journal of Computational Social Science.
"Undersøgelser som dette giver os mulighed for at forstå nuancerne i det 21. århundredes hverdag. Vi lever i sådan en forargelse, berømthedsdrevet kultur i dag, at det er let at glemme, at de fleste af os kun er fokuseret på at gå i gang med vores forretning:at spise, pendling, arbejder, klager. Vi dokumenterer mere af det på sociale medier, end vi er klar over. Denne teknologi giver os mulighed for at læse historien om vores samfund – som den bliver skrevet, lige foran vores øjne, " siger Kejriwal.