Dømt til at mislykkes? Kredit:Shutterstock
I løbet af det sidste årti, ændringer i den måde, folk handler på, har fået flere og flere virksomheder til at lukke deres døre, fra små musiksteder til boghandlere og endda større stormagasiner. Denne tendens er blevet tilskrevet flere faktorer, herunder et skift mod online shopping og ændrede udgiftspræferencer. Men lukninger af virksomheder er komplekse, og ofte på grund af mange sammenflettede faktorer.
For bedre at forstå og redegøre for nogle af disse faktorer, mine kolleger ved University of Cambridge og Singapore Management University og jeg byggede en machine learning -model, som forudsagde lukning af butikker i ti byer rundt om i verden med 80% nøjagtighed.
Vores forskning modellerede, hvordan mennesker bevæger sig gennem byområder, at forudsige, om en given virksomhed vil lukke ned. Denne forskning kan hjælpe bymyndigheder og virksomhedsejere med at træffe bedre beslutninger, for eksempel om licensaftaler og åbningstider.
Mønster spotting
Machine learning er et kraftfuldt værktøj, der automatisk kan identificere mønstre i data. En machine learning -model bruger disse mønstre til at teste hypoteser og lave forudsigelser. Sociale medier giver en rig datakilde til at undersøge brugernes mønstre gennem deres indlæg, interaktioner og bevægelser. Detaljerne i disse datasæt kan hjælpe forskere med at bygge robuste modeller, med en kompleks forståelse af brugertendenser.
Brug af data om forbrugernes efterspørgsel og transport, sammen med grund-sandhedsdata om, hvorvidt virksomheder rent faktisk lukkede, vi udarbejdede metrics, som vores machine learning -model brugte til at identificere mønstre. Vi analyserede derefter, hvor godt denne model forudsagde, om en virksomhed ville lukke, givet kun metrics om den forretning og det område, den befandt sig i.
Vores første datasæt var fra Foursquare, en placeringsanbefalingsplatform, som inkluderede check-in detaljer om anonyme brugere og repræsenterede efterspørgslen efter virksomheder over tid. Vi brugte også data fra taxibaner, hvilket gav os afhentnings- og afleveringspunkter for tusinder af anonyme brugere; disse repræsenterede dynamik i, hvordan mennesker bevæger sig mellem forskellige områder af en by. Vi brugte historiske data fra 2011 til 2013.
Vi kiggede på et par forskellige målinger. Nabolagsprofilen tog hensyn til området omkring en virksomhed, såsom de forskellige slags virksomheder, der også driver, samt konkurrence. Kundebesøgsmønstre repræsenterede, hvor populær en virksomhed var på et givet tidspunkt på dagen, sammenlignet med sine lokale konkurrenter. Og forretningsattributter definerede grundlæggende ejendomme som f.eks. Prisklassen og virksomhedstypen.
Disse tre metrics satte os i stand til at modellere, hvordan lukningsforudsigelser er forskellige mellem nye og etablerede spillesteder, hvordan forudsigelserne varierede på tværs af byer, og hvilke metrics var de mest betydningsfulde forudsigere for lukning. Vi var i stand til at forudsige lukning af etablerede virksomheder mere præcist, hvilket antydede, at nye virksomheder kan stå over for lukning af flere årsager.
At lave forudsigelser
Vi fandt ud af, at forskellige metrics var nyttige til at forudsige lukninger i forskellige byer. Men på tværs af de ti byer i vores eksperiment - herunder Chicago, London, New York, Singapore, Helsinki, Jakarta, Los Angeles, Paris, San Fransciso og Tokyo - vi så, at tre faktorer næsten altid var væsentlige forudsigere for en virksomheds lukning.
Den første vigtige faktor var det tidsrum, hvor en virksomhed var populær. Vi fandt ud af, at virksomheder, der kun henvender sig til bestemte kundesegmenter - f.eks. en café populær blandt kontorarbejdere ved frokosttid - er mere tilbøjelige til at lukke. Det var også vigtigt, når en virksomhed var populær, sammenlignet med sine konkurrenter i kvarteret. Virksomheder, der var populære uden for de typiske timer for andre virksomheder i området, havde en tendens til at overleve længere.
Vi fandt også ud af, at når mangfoldigheden af virksomheder faldt, sandsynligheden for lukning steg. Så virksomheder, der ligger i kvarterer med en mere forskelligartet blanding af virksomheder, havde en tendens til at overleve længere.
Selvfølgelig, ligesom ethvert datasæt, de oplysninger, vi brugte fra Foursquare og taxier, er forudindtaget på nogle måder, da brugerne kan være skævt mod visse demografiske oplysninger eller tjekke ind på nogle typer virksomheder mere end andre. Men ved at bruge to datasæt, der er målrettet mod forskellige slags brugere, vi håbede på at dæmpe disse fordomme. Og konsistensen af vores analyse på tværs af flere byer gav os tillid til vores resultater.
Vi håber, at denne nye tilgang til at forudsige lukninger af virksomheder med meget detaljerede datasæt vil hjælpe med at afsløre ny indsigt om, hvordan forbrugere bevæger sig rundt i byer, og informere virksomhedsejernes beslutninger, lokale myndigheder og byplanlæggere rundt om i verden.
Denne artikel er genudgivet fra The Conversation under en Creative Commons -licens. Læs den originale artikel.