I ricercatori hanno utilizzato una combinazione di dati provenienti dai social media e dai mezzi di trasporto pubblico per prevedere la probabilità che una data attività al dettaglio abbia successo o fallisca. Utilizzando le informazioni di dieci diverse città in tutto il mondo, i ricercatori, guidati dall’Università di Cambridge, hanno sviluppato un modello in grado di prevedere con una precisione dell’80% se una nuova attività fallirà entro sei mesi.
I risultati saranno presentati alla conferenza ACM su Pervasive e Ubiquitous Computing (Ubicomp), che si terrà questa settimana a Singapore.
Il settore della vendita al dettaglio è sempre stato rischioso, ma negli ultimi anni in particolare si è assistito a una trasformazione delle vie dello shopping via via che sempre più rivenditori chiudono i battenti dei loro punti vendita. Il modello costruito dai ricercatori potrebbe essere utile, sia per gli imprenditori che per gli addetti all’urbanistica, per determinare dove posizionare la propria attività o in quali aree investire.
“Una delle domande più importanti per qualsiasi nuova attività è la quantità di domanda che riceverà, direttamente correlata alla probabilità che tale attività abbia successo”, ha affermato l’autore principale Krittika D’Silva, studioso di Gates e studente di dottorato presso il Dipartimento di Cambridge di Computer Science and Technology.
Che tipo di metriche possiamo usare per fare queste previsioni?
D’Silva e i suoi colleghi hanno utilizzato oltre 74 milioni di check-in location-based da social network provenienti da Chicago, Helsinki, Jakarta, Londra, Los Angeles, New York, Parigi, San Francisco, Singapore e Tokyo; e dati da 181 milioni di viaggi in taxi da New York e Singapore.
Utilizzando questi dati, i ricercatori hanno classificato i luoghi in base alle proprietà dei quartieri in cui si trovavano, le visite in diversi momenti della giornata e se un quartiere attraeva visitatori da altri quartieri.
“Volevamo capire meglio il potere predittivo che le metriche su un luogo in un determinato momento hanno”, ha detto D’Silva. Se un’azienda ha successo o fallisce, normalmente si basa su un numero di fattori controllabili e incontrollabili. I fattori controllabili potrebbero includere la qualità o il prezzo del prodotto del negozio, i suoi orari di apertura e la soddisfazione del cliente. I fattori incontrollabili invece potrebbero includere i tassi di disoccupazione di una città, le condizioni economiche generali e le politiche urbane.
“Abbiamo scoperto che anche senza informazioni su nessuno di questi fattori incontrollabili, potremmo utilizzare le funzionalità specifiche della sede, relative alla posizione e alla mobilità nel prevedere la probabile scomparsa di un’impresa”, ha affermato D’Silva.
I risultati
I dati hanno mostrato che in tutte e dieci le città, le sedi che sono popolari 24 ore su 24, piuttosto che solo in determinati momenti della giornata, hanno maggiori probabilità di successo. Inoltre, i luoghi che sono visitati al di fuori delle ore popolari tipiche di altri luoghi del quartiere tendono a sopravvivere più a lungo.
I dati hanno anche suggerito che le sedi nei diversi quartieri, con più tipi di imprese, tendono a sopravvivere più a lungo. Mentre le dieci città avevano alcune somiglianze, i ricercatori dovevano anche spiegare le loro differenze.
“Le metriche che erano utili predittori variano da città a città, il che suggerisce che i fattori influenzano le città in modi diversi”, ha detto D’Silva. “Ad esempio, la velocità di viaggio verso una sede è una metrica significativa solo a New York e Tokyo, in relazione alla velocità di transito in quelle città o forse ai tassi di traffico”.
I test del modello
Per testare il potere predittivo del loro modello, i ricercatori hanno dovuto prima determinare se una specifica sede fosse stata chiusa all’interno della finestra temporale del loro set di dati. Hanno quindi dato forma al modello su un sottogruppo di luoghi, dicendo al modello quali fossero le caratteristiche di quei luoghi nella finestra temporale della prima volta e se la sede fosse aperta o chiusa in una seconda finestra temporale.
Hanno quindi testato il modello su un altro sottoinsieme di dati per vedere quanto fosse accurato. Secondo i ricercatori, il loro modello mostra che quando si decide quando e dove aprire un’attività, è importante guardare oltre le caratteristiche statiche di un determinato quartiere e considerare i modi in cui le persone si spostano verso e attraverso quel quartiere in momenti diversi del giorno.
Il prossimo passo sarà quello di considerare come queste caratteristiche variano tra i diversi quartieri al fine di migliorare la precisione del loro modello.