Videnskab
 Science >> Videnskab >  >> Biologi

Analyse af milliarder Twitter-ord afslører, hvordan amerikansk engelsk udvikler sig

Titel: Analyse af milliarder af Twitter-ord afslører, hvordan amerikansk engelsk udvikler sig

Abstrakt:

Denne undersøgelse giver en storstilet analyse af udviklingen i amerikansk engelsk ved hjælp af data fra milliarder af ord, der er lagt ud på Twitter mellem 2008 og 2020. Vi undersøger, hvordan frekvensen og brugsmønstrene for ord ændrer sig over tid, herunder fremkomsten af ​​nye ord, faldet af gamle, og skift i ordenes betydning. Vores resultater kaster lys over sprogets dynamiske karakter og giver indsigt i de kulturelle, sociale og teknologiske faktorer, der former udviklingen af ​​amerikansk engelsk.

Søgeord: Amerikansk engelsk, Twitter-data, sprogændring, ordfrekvens, semantisk skift

Introduktion:

Sproget er et dynamisk fænomen, der konstant ændrer sig over tid. Nye ord introduceres, gamle ord falder ud af brug, og eksisterende ord kan ændre betydning. Disse ændringer er påvirket af en række faktorer, herunder kulturelle, sociale, teknologiske og miljømæssige ændringer.

I de senere år har tilgængeligheden af ​​digital tekstdata i stor skala gjort det muligt for forskere at studere sprogændringer i hidtil usete detaljer. Især Twitter giver en rig kilde til data til at analysere sprogbrug i realtid. Med millioner af brugere, der aktivt poster på platformen, giver Twitter et indblik i den nuværende tilstand af amerikansk engelsk, og hvordan den udvikler sig.

Metode :

For at analysere udviklingen af ​​amerikansk engelsk på Twitter indsamlede vi et datasæt med milliarder af ord, der blev postet mellem 2008 og 2020. Vi forbehandlede først dataene ved at fjerne ikke-engelske ord, tegnsætning og URL'er. Vi tokeniserede derefter teksten til ord og talte hyppigheden af ​​hvert ord hvert år.

For at spore ændringen i ordfrekvens over tid, beregnede vi ordfrekvensvæksthastigheden, defineret som procentpoint ændring i ordfrekvens fra et år til det næste.

Desuden brugte vi ordindlejringsteknikker til at fange den semantiske lighed mellem ord. Ved at bruge en forudtrænet ordindlejringsmodel beregnede vi cosinus-ligheden mellem ordvektorer og sammenlignede ords semantiske slægtskab over tid.

Resultater:

1. Nye ords opståen:

Vi fandt ud af, at tusindvis af nye ord dukkede op på Twitter i løbet af undersøgelsesperioden. Mange af disse ord var relateret til nye teknologier, sociale medier og populærkultur, hvilket afspejler det hurtige tempo i teknologiske fremskridt og kulturelle forandringer.

2. Afvisning af gamle ord:

Visse ord oplevede et fald i frekvens over tid, hvilket indikerer et skift i deres brug eller relevans. Nogle afviste ord var relateret til forældede teknologier, modetrends eller politiske figurer.

3. Semantisk skift:

Vores analyse afslørede også et semantisk skift i betydningen af ​​visse ord over tid. For eksempel betød ordet "bogstaveligt" oprindeligt "i bogstavelig forstand", men dets brug på Twitter formidlede ofte en betoning eller overdrivelse.

4. Indflydelse af sociale og kulturelle begivenheder:

Større sociale og kulturelle begivenheder havde en betydelig indflydelse på sprogbrugen. For eksempel oplevede ordet "selfie" en dramatisk stigning i frekvensen efter fremkomsten af ​​mobiltelefonfotografering og brugen af ​​sociale medieplatforme som Instagram.

Konklusion:

Analysen af ​​milliarder af Twitter-ord giver indsigt i den dynamiske karakter af amerikansk engelsk, og hvordan det udvikler sig over tid. Nye ord dukker op, gamle ord falder, og ordenes betydning kan skifte på grund af kulturelle, sociale og teknologiske ændringer. Twitter-data tjener som en værdifuld ressource til at studere sprogændringer i realtid, hvilket giver forskere mulighed for at spore sprogudviklingen i hidtil uset detalje.

Konsekvenser:

Resultaterne af denne undersøgelse har implikationer for forskellige områder, herunder historisk lingvistik, sociologi og kulturstudier. At forstå udviklingen af ​​amerikansk engelsk kan give værdifuld information om samfundsændringer, kulturelle tendenser og sprogbrugeres skiftende behov.

Varme artikler