Crédit :CC0 Domaine public
Les chercheurs d'appartements dans les grandes villes utilisent souvent la présence de restaurants pour déterminer si un quartier serait un bon endroit où vivre. Il s'avère qu'il y a beaucoup de choses dans cette règle empirique :les chercheurs en études urbaines du MIT ont maintenant découvert qu'en Chine, les données sur les restaurants peuvent être utilisées pour prédire les principaux attributs socio-économiques des quartiers.
En effet, en utilisant les données des restaurants en ligne, disent les chercheurs, ils peuvent prédire efficacement la population diurne d'un quartier, population nocturne, le nombre d'entreprises qui s'y trouvent, et le montant des dépenses globales dans le quartier.
« La restauration est l'une des industries de consommation locale les plus décentralisées et dérégulées, " dit Siqi Zheng, un professeur d'études urbaines au MIT et co-auteur d'un nouvel article décrivant les résultats. « Il est fortement corrélé avec les attributs socio-économiques locaux, comme la population, richesse, et la consommation."
L'utilisation des données sur les restaurants comme approximation d'autres indicateurs économiques peut avoir un objectif pratique pour les urbanistes et les décideurs, disent les chercheurs. En Chine, comme dans beaucoup d'endroits, un recensement n'est effectué qu'une fois par décennie, et il peut être difficile d'analyser la dynamique des zones en constante évolution d'une ville à un rythme plus rapide. Ainsi, de nouvelles méthodes de quantification des niveaux résidentiels et de l'activité économique pourraient aider à guider les responsables municipaux.
"Même sans données de recensement, nous pouvons prédire une variété d'attributs d'un quartier, ce qui est très précieux, " ajoute Zheng, qui est le professeur agrégé Samuel Tak Lee de développement immobilier et d'entrepreneuriat, et directeur de la faculté du MIT China Future City Lab.
"Aujourd'hui, il y a une grande fracture des données, " dit Carlo Ratti, directeur du Senseable City Lab du MIT, et co-auteur de l'article. « Les données sont cruciales pour mieux comprendre les villes, mais dans de nombreux endroits, nous n'avons pas beaucoup de données [officielles]. À la fois, nous avons de plus en plus de données générées par des applications et des sites Web. Si nous utilisons cette méthode, nous [pouvons] comprendre les données socio-économiques des villes où elles ne collectent pas de données."
Le papier, "Prédire les attributs socio-économiques des quartiers à l'aide des données des restaurants, " apparaît dans le Actes de l'Académie nationale des sciences . Les auteurs sont Zheng, qui est l'auteur correspondant ; Ratti; et Lei Dong, un post-doctorat co-organisé par le MIT China Future City Lab et le Senseable City Lab.
L'étude examine de près au niveau des quartiers neuf villes de Chine :Baoding, Pékin, Chengdu, Hengyang, Kunming, Shenyang, Shenzen, Yueyang, et Zhengzhou. Pour mener l'étude, les chercheurs ont extrait les données des restaurants du site Web Dianping, qu'ils décrivent comme l'équivalent chinois de Yelp, le site d'examen des affaires en anglais.
En faisant correspondre les données Dianping à des données fiables, les données existantes pour ces villes, y compris les données de localisation des téléphones portables anonymisées et agrégées de 56,3 millions de personnes, les relevés de cartes bancaires, registres d'enregistrement de la société, et certaines données de recensement - les chercheurs ont découvert qu'ils pouvaient prédire 95 pour cent de la variation de la population diurne entre les quartiers. Ils ont également prédit 95 pour cent de la variation de la population nocturne, 93 % de la variation du nombre d'entreprises, et 90 pour cent de la variation des niveaux de consommation des consommateurs.
« Nous avons utilisé de nouvelles données accessibles au public et développé de nouvelles méthodes d'augmentation des données pour résoudre ces problèmes urbains, " dit Dong, qui ajoute que le modèle de l'étude est une "nouvelle contribution à [l'utilisation de] la science des données pour le bien social, et les mégadonnées pour les communautés économiques urbaines."
Les chercheurs notent qu'il s'agit d'une approximation plus précise pour estimer l'activité démographique et économique au niveau du quartier que les autres méthodes utilisées auparavant. Par exemple, d'autres chercheurs ont utilisé l'imagerie satellitaire pour calculer la quantité de lumière nocturne dans les villes, et à son tour utilisé la quantité de lumière pour estimer l'activité au niveau du quartier. Bien que cette méthode fonctionne bien pour les estimations de population, la méthode restaurant-data est globalement meilleure, et bien mieux pour estimer l'activité commerciale et les dépenses de consommation.
Zheng dit qu'elle se sent "confiante" que le modèle des chercheurs pourrait être appliqué à d'autres villes chinoises, car il montre déjà un bon pouvoir prédictif dans toutes les villes. Mais les chercheurs pensent également que la méthode qu'ils ont employée, qui utilise des techniques d'apprentissage automatique pour se concentrer sur des corrélations significatives, pourrait potentiellement être appliquée aux villes du monde entier.
"Ces résultats indiquent que les données des restaurants peuvent capturer des indicateurs communs de résultats socio-économiques, et ces points communs peuvent être transférés... avec une précision raisonnable dans les villes où les résultats des enquêtes ne sont pas observés, ", déclarent les chercheurs dans le journal.
Comme le reconnaissent les savants, leur étude a observé des corrélations entre les données des restaurants et les caractéristiques du quartier, plutôt que de préciser les mécanismes causaux exacts à l'œuvre. Ratti note que le lien de causalité entre les restaurants et les caractéristiques du quartier peut aller dans les deux sens :parfois, les restaurants peuvent répondre à la demande dans un quartier déjà florissant, tandis qu'à d'autres moments, leur présence est un signe avant-coureur d'un développement futur.
« Il y a toujours [à la fois] une poussée et une traction » entre les restaurants et le développement du quartier, dit Ratti. "Mais nous montrons que les données socio-économiques sont très bien reflétées dans le paysage de la restauration, dans les villes que nous regardons. La découverte intéressante est que cela semble être si bon comme proxy."
Zheng dit qu'elle espère que d'autres chercheurs reprendront la méthode, ce qui en principe pourrait être appliqué à de nombreux sujets d'études urbaines.
"Les données du restaurant elles-mêmes, ainsi que la variété des attributs du quartier qu'il prédit, peut aider d'autres chercheurs à étudier toutes sortes de problèmes urbains, ce qui est très précieux, " dit Zheng.