Une carte montrant les notes moyennes des avis pour divers quartiers de la ville de New York sur la base des avis sur Niche.com au cours de la période d'étude, 5 étant la note la plus élevée possible. Crédit :Yingjie Hu
Tous les jours, les gens partagent en ligne une quantité vertigineuse d'informations sur les communautés locales. Ils se demandent si leurs voisins sont amicaux, à quel point les bus fonctionnent, quels types de restaurants se trouvent dans une zone, et beaucoup, beaucoup plus.
Une nouvelle étude menée par le chercheur de l'Université de Buffalo, Yingjie Hu, montre comment nous pouvons trier cette vaste mine de données numériques pour améliorer les villes et la qualité de vie des gens.
La recherche, publié le 8 mars dans le Annales de l'Association américaine des géographes , analysé les critiques de quartiers de plus de 7, 600 utilisateurs uniques qui ont publié des articles sur New York sur le site Web Niche.com.
L'objectif était de trier efficacement des milliers d'opinions pour en savoir plus sur la perception que les gens ont de leurs communautés. L'étude a combiné l'analyse spatiale, des techniques d'apprentissage automatique et de traitement du langage naturel pour identifier les caractéristiques des quartiers dont les gens ont parlé en ligne, et quels étaient les sentiments généraux des examinateurs à propos de ces attributs.
Ce type de recherche pourrait aider les urbanistes à repérer les problèmes qu'ils pourraient autrement manquer, dit Hu.
« Il faut beaucoup de temps pour se renseigner sur les quartiers par des enquêtes ou des entretiens en face à face. Ainsi, bien que les données des enquêtes ou des entretiens soient très précieuses, si vous êtes un planificateur, vous ne pourrez peut-être pas collecter ce type de données fréquemment ou pour de grandes zones géographiques, " dit Hu, Doctorat., professeur adjoint de géographie à l'Université du Buffalo College of Arts and Sciences et expert dans le domaine des sciences de l'information géographique (GIScience).
"En revanche, les données en ligne que nous recherchons sont mises à jour en permanence, " Hu ajoute. " Les gens publient toujours de nouvelles critiques de quartier. Nous voulons utiliser cette ressource pour découvrir de nouvelles informations pouvant prendre en charge une variété d'applications."
Les co-auteurs de l'étude comprenaient Chengbin Deng, Doctorat., et Zhou Zhou, tous deux à l'Université de Binghamton.
Les avis en ligne permettent aux planificateurs d'accéder à des milliers d'opinions
L'analyse des chercheurs a révélé que dans certains cas, les perceptions des gens d'une communauté ne correspondaient pas à l'image présentée par d'autres données. Par exemple, alors que les sentiments des examinateurs au sujet de la sécurité correspondaient généralement aux statistiques sur la criminalité, les autres catégories n'étaient pas aussi bien corrélées, dit Hu.
Les écarts se produisent pour de nombreuses raisons, et certains peuvent être révélateurs. En matière d'emploi, les revues de quartier discutaient de la qualité des emplois dans un quartier, un problème qui n'est pas capturé par des statistiques générales comme le taux de chômage. De même, en matière de transports en commun, les gens s'inquiétaient de la fiabilité :les bus étaient-ils à l'heure ou en retard ? Les planificateurs pourraient passer à côté de ce problème s'ils se concentrent sur des mesures telles que le nombre de lignes de bus ou de centres de transit dans un quartier.
Hu prévient que les avis en ligne ne doivent pas être utilisés isolément :les personnes qui publient sont auto-sélectionnées, ils peuvent donc ne pas représenter les points de vue de tous les habitants d'un quartier.
Toujours, Hu dit que la collecte de données peut compléter les enquêtes, entretiens en face-à-face et autres méthodes existantes d'apprentissage sur les quartiers. L'analyse des données en ligne peut permettre aux planificateurs d'accéder rapidement aux informations de nombreuses personnes.
« L'un des avantages des données d'examen de quartier en ligne est qu'il devient relativement facile d'accéder aux opinions de nombreuses personnes - dans le cas de notre étude, plus de 7, 600, " dit Hu. " Si vous pensez à ce qu'il faut pour interviewer même 100 personnes, cela demande beaucoup de temps et de ressources. Les données des revues de quartier sont loin d'être parfaites, mais cela peut aider à compléter d'autres types de données que nous avons déjà."