Videnskab
 science >> Videnskab >  >> Elektronik

Data på sociale medier bruges til at forudsige detailfejl

Kredit:CC0 Public Domain

Forskere har brugt en kombination af sociale medier og transportdata til at forudsige sandsynligheden for, at en given detailforretning vil lykkes eller mislykkes.

Ved hjælp af oplysninger fra ti forskellige byer rundt om i verden, forskerne, ledet af University of Cambridge, har udviklet en model, der med 80 % nøjagtighed kan forudsige, om en ny virksomhed vil fejle inden for seks måneder. Resultaterne vil blive præsenteret på ACM Conference on Pervasive and Ubiquitous Computing (Ubicomp), finder sted i denne uge i Singapore.

Mens detailsektoren altid har været risikabel, de sidste mange år har oplevet en transformation af hovedgaderne, da flere og flere forhandlere fejler. Modellen bygget af forskerne kan være nyttig for både iværksættere og byplanlæggere, når de skal bestemme, hvor de skal placere deres virksomhed, eller hvilke områder der skal investeres i.

"Et af de vigtigste spørgsmål for enhver ny virksomhed er mængden af ​​efterspørgsel, den vil modtage. Dette er direkte relateret til, hvor sandsynligt det er, at forretningen vil lykkes, " sagde hovedforfatter Krittika D'Silva, en Gates Scholar og Ph.D. studerende ved Cambridge's Department of Computer Science and Technology. "Hvilken slags målinger kan vi bruge til at lave disse forudsigelser?"

D'Silva og hendes kolleger brugte mere end 74 millioner check-in fra det lokationsbaserede sociale netværk Foursquare fra Chicago, Helsinki, Jakarta, London, Los Angeles, New York, Paris, San Francisco, Singapore og Tokyo; og data fra 181 millioner taxature fra New York og Singapore.

Ved at bruge disse data, forskerne klassificerede spillesteder efter egenskaberne i de kvarterer, hvor de var placeret, besøgsmønstre på forskellige tidspunkter af dagen, og om et kvarter tiltrak besøgende fra andre kvarterer.

"Vi ønskede bedre at forstå den forudsigelseskraft, som målinger om et sted på et bestemt tidspunkt har, " sagde D'Silva.

Hvorvidt en virksomhed lykkes eller fejler, er normalt baseret på en række kontrollerbare og ukontrollerbare faktorer. Kontrollerbare faktorer kan omfatte kvaliteten eller prisen på butikkens produkt, dens åbningstider og dens kundetilfredshed. Ukontrollerbare faktorer kan omfatte arbejdsløshed i en by, overordnede økonomiske forhold og bypolitikker.

"Vi fandt ud af, at selv uden information om nogen af ​​disse ukontrollerbare faktorer, vi kunne stadig bruge mødestedsspecifikke, lokationsrelaterede og mobilitetsbaserede funktioner til at forudsige en virksomheds sandsynlige død, " sagde D'Silva.

Dataene viste, at i alle ti byer, steder, der er populære døgnet rundt, snarere end blot på bestemte tidspunkter af dagen, er mere tilbøjelige til at lykkes. Derudover spillesteder, der er efterspurgte uden for de typiske populære timer på andre spillesteder i nabolaget, har en tendens til at overleve længere.

Dataene tydede også på, at spillesteder i forskellige kvarterer, med flere typer virksomheder, har tendens til at overleve længere.

Mens de ti byer havde visse ligheder, forskerne skulle også redegøre for deres forskelle.

"De metrics, der var nyttige forudsigere, varierer fra by til by, hvilket tyder på, at faktorer påvirker byer på forskellige måder, " sagde D'Silva. "Som et eksempel, at rejsehastigheden til et spillested kun er en væsentlig målestok i New York og Tokyo. Dette kan relatere til transithastigheden i disse byer eller måske til trafikhastigheden."

For at teste deres models forudsigelsesevne, forskerne skulle først afgøre, om et bestemt sted var lukket inden for tidsvinduet for deres datasæt. De 'trænede' derefter modellen på en undergruppe af spillesteder, fortælle modellen, hvad funktionerne ved disse spillesteder var i det første tidsvindue, og om spillestedet var åbent eller lukket i et andet tidsvindue. De testede derefter den trænede model på en anden delmængde af dataene for at se, hvor nøjagtig den var.

Ifølge forskerne, deres model viser, at når man beslutter sig for hvornår og hvor man skal åbne en virksomhed, det er vigtigt at se ud over de statiske træk ved et givent kvarter og at overveje, hvordan folk bevæger sig til og gennem kvarteret på forskellige tidspunkter af dagen. De ønsker nu at overveje, hvordan disse funktioner varierer på tværs af forskellige kvarterer for at forbedre nøjagtigheden af ​​deres model.


Varme artikler