Videnskab
 science >> Videnskab >  >> Andet

Analyse af milliarder af Twitter-ord afslører, hvordan amerikansk engelsk udvikler sig

Kredit:CC0 Public Domain

Sprogforskere og geografer analyserede 8,9 milliarder ord indeholdt i 980 millioner Tweets, der blev sendt over hele USA mellem 2013 og 2014 for at identificere de regioner, hvorfra nye ord har tendens til at stamme.

Ledet af professor Jack Grieve, fra Center for Corpus Research ved University of Birmingham, forskere brugte avanceret computerteknologi til at analysere de geokodede tweets, som afslørede brugerens præcise længde- og breddegrad på tidspunktet for indlægget.

De sporede oprindelsen af ​​54 nye ord på amerikansk engelsk. For eksempel, de fandt ud af, at ordet 'baeless', hvilket betyder 'at være single', stammer fra Deep South, mens ordet 'gensidige', som er en forkortelse for 'fælles venner', stammer fra Vestkysten.

Geokodede data fra Twitter gjorde det muligt for dem at oprette kort til disse 54 ord, viser, hvordan sætningerne havde spredt sig over hele landet over tid.

Anvendelse af moderne beregningsteknikker til studiet af sproglig variation og forandring, holdet identificerede, at udviklingen af ​​nye ord på moderne amerikansk engelsk var centreret om fem regioner:Vestkysten, det nordøstlige, det midterste Atlanterhav, det dybe syd, og Gulf Coast.

Professor Grieve kommenterede:"Dette er første gang, at et så stort udsnit af nye ord eller enhver form for sproglig innovation er blevet kortlagt på ét sprog. Twitter er kun én variation af sprog, men i betragtning af at næsten alle disse ord bruges i daglig tale, vi mener, at vores resultater afspejler ordenes generelle spredning på amerikansk engelsk.

"Vores undersøgelse giver en ramme for fremtidig forskning ved at vise, hvordan oprindelsen og spredningen af ​​nye ord kan måles og kortlægges. Sprogvidenskaben skifter fra en samfundsvidenskab til en datavidenskab, hvor lingvister i stigende grad analyserer enorme mængder naturligt sprog høstet online.

"Dette giver os mulighed for at forfølge nye forskningsspørgsmål, som ville have været umulige at undersøge for bare et par år siden. Vi kan i meget fine detaljer analysere, hvordan sproget ændrer sig over korte perioder og forstå de processer, som sprog udvikler sig igennem - en af ​​de mest udfordrende spørgsmål inden for videnskab."

Forskernes resultater udfordrer også eksisterende teorier om spredning af nye ord. De viser, at nye ord ikke blot spredes uhindret fra deres kilde, og de spreder sig heller ikke fra den ene storby til den næste, som forudsagt af tidligere udviklede teorier for spredning af nye ord, kendt som 'bølge' og 'tyngdekraft' modellerne.

I stedet, undersøgelsen viste, at spredningen af ​​nye ord er begrænset af kulturelle mønstre. Nye ord har tendens til at spredes inden for kulturelle regioner, før de når resten af ​​USA. Den fandt også, at afroamerikansk engelsk var en vigtig kilde til leksikalsk innovation på amerikansk Twitter.

Professor Grieve taler om holdets forskning på konferencen New Ways of Analyzing Variation (NWAV) afholdt på New York University fra den 18. til den 21. oktober. Han vil fokusere på, hvordan disse ord spredte sig netop i New York City over den pågældende tidsperiode, samt at levere en workshop om 'computational sociolinguistics'.