Une carte détaillée des niveaux de pollution à Pékin et ses environs à l'aide d'un nouvel algorithme d'apprentissage automatique pour les images satellite et la météo. Crédit :Tongshu Zheng, université de Duke
Des chercheurs de l'Université Duke ont mis au point une méthode pour estimer la qualité de l'air sur une petite parcelle de terre en utilisant uniquement des images satellite et des conditions météorologiques. De telles informations pourraient aider les chercheurs à identifier les points chauds cachés de pollution dangereuse, améliorer grandement les études de pollution sur la santé humaine, ou potentiellement déceler les effets d'événements imprévisibles sur la qualité de l'air, comme l'éclatement d'une pandémie mondiale aéroportée.
Les résultats sont publiés en ligne dans la revue Environnement atmosphérique .
"Nous avons utilisé une nouvelle génération d'images micro-satellites pour estimer la pollution atmosphérique au niveau du sol à la plus petite échelle spatiale à ce jour, " a déclaré Mike Bergin, professeur de génie civil et environnemental à Duke. "Nous avons pu le faire en développant une approche totalement nouvelle qui utilise l'IA/l'apprentissage automatique pour interpréter les données des images de surface et des stations au sol existantes."
La mesure spécifique de la qualité de l'air qui intéresse Bergin et ses collègues est la quantité de minuscules particules en suspension dans l'air appelées PM2,5. Ce sont des particules qui ont un diamètre inférieur à 2,5 micromètres, soit environ trois pour cent du diamètre d'un cheveu humain, et il a été démontré qu'elles ont un effet dramatique sur la santé humaine en raison de leur capacité à pénétrer profondément dans les poumons.
Par exemple, Les PM2,5 ont été classées au niveau mondial comme le cinquième facteur de risque de mortalité, responsable d'environ 4,2 millions de décès et 103,1 millions d'années de vie perdues ou vécues avec un handicap, par l'étude de 2015 sur la charge mondiale de morbidité. Et dans une étude récente de l'Université Harvard T.H. École de santé publique Chan, les chercheurs ont découvert que les zones avec des niveaux plus élevés de PM2,5 sont également associées à des taux de mortalité plus élevés en raison de COVID-19.
Les meilleures pratiques actuelles en matière de télédétection pour estimer la quantité de PM2,5 au niveau du sol utilisent des satellites pour mesurer la quantité de lumière solaire renvoyée dans l'espace par les particules ambiantes sur l'ensemble de la colonne atmosphérique. Cette méthode, cependant, peuvent souffrir d'incertitudes régionales telles que les nuages et les surfaces brillantes, mélange atmosphérique, et les propriétés des particules PM, et ne peut pas faire d'estimations précises à des échelles inférieures à environ un kilomètre carré. Alors que les stations de surveillance de la pollution au sol peuvent fournir des mesures directes, ils souffrent de leurs propres inconvénients et ne sont que peu localisés dans le monde.
« Les stations au sol sont coûteuses à construire et à entretenir, donc même les grandes villes ne sont pas susceptibles d'en avoir plus d'une poignée, " a déclaré Bergin. " De plus, ils sont presque toujours placés dans des zones éloignées de la circulation et d'autres grandes sources locales, Ainsi, bien qu'ils puissent donner une idée générale de la quantité de PM2,5 dans l'air, ils sont loin de donner une vraie distribution pour les personnes vivant dans différents quartiers de cette ville. »
Dans leur recherche d'une meilleure méthode, Bergin et son doctorant Tongshu Zheng se sont tournés vers Planet, une entreprise américaine qui utilise des micro-satellites pour prendre des photos de toute la surface de la Terre chaque jour avec une résolution de trois mètres par pixel. L'équipe a pu obtenir un instantané quotidien de Pékin au cours des trois dernières années.
La percée clé est venue lorsque David Carlson, professeur assistant en génie civil et environnemental à Duke et expert en machine learning, est intervenu pour aider.
Six photos différentes prises du même quartier de Pékin à des jours différents, avec différents niveaux de pollution de l'air. Alors que l'œil humain nu peut clairement dire que certains jours sont plus pollués que d'autres, un nouvel algorithme d'apprentissage automatique peut faire des estimations raisonnablement précises de la pollution de l'air au niveau du sol. Crédit :Tongshu Zheng, université de Duke
"Quand je vais à des conférences sur le machine learning et l'intelligence artificielle, Je suis généralement la seule personne d'un département d'ingénierie environnementale, " a déclaré Carlson. " Mais ce sont les types exacts de projets que je suis ici pour aider à soutenir, et pourquoi Duke accorde une si grande importance au recrutement d'experts en données dans toute l'université."
Avec l'aide de Carlson, Bergin et Zheng ont appliqué un réseau neuronal convolutif avec un algorithme de forêt aléatoire à l'ensemble d'images, combiné avec les données météorologiques de la station météorologique de Pékin. Bien que cela puisse ressembler à une bouchée, ce n'est pas si difficile de se frayer un chemin à travers les arbres.
Une forêt aléatoire est un algorithme d'apprentissage automatique standard qui utilise de nombreux arbres de décision différents pour faire une prédiction. Nous avons tous vu des arbres de décision, peut-être comme un mème Internet qui utilise une série de questions oui/non pour décider de manger ou non un burrito. Sauf dans ce cas, l'algorithme examine les arbres de décision basés sur des métriques telles que le vent, humidité relative, température et plus, et en utilisant les réponses obtenues pour arriver à une estimation des concentrations de PM2,5.
Cependant, les algorithmes de forêt aléatoire ne traitent pas bien les images. C'est là qu'interviennent les réseaux de neurones convolutifs. Ces algorithmes recherchent des caractéristiques communes dans des images telles que des lignes et des bosses et commencent à les regrouper. Au fur et à mesure que l'algorithme "dézoome, " il continue de regrouper des groupements similaires, combinant des formes de base dans des caractéristiques communes telles que des bâtiments et des autoroutes. Finalement, l'algorithme propose un résumé de l'image sous forme de liste de ses caractéristiques les plus courantes, et ceux-ci sont jetés dans la forêt aléatoire avec les données météorologiques.
"Les images très polluées sont définitivement plus brumeuses et plus floues que les images normales, mais l'œil humain ne peut pas vraiment dire les niveaux exacts de pollution à partir de ces détails, ", a déclaré Carlson. "Mais l'algorithme peut détecter ces différences dans les caractéristiques de bas et de haut niveau - les bords sont plus flous et les formes sont plus obscurcies - et les transformer avec précision en estimations de la qualité de l'air."
"Le réseau de neurones convolutifs ne nous donne pas une prédiction aussi bonne que nous le souhaiterions avec les images seules, " a ajouté Zheng. " Mais quand vous mettez ces résultats dans une forêt aléatoire avec des données météorologiques, les résultats sont aussi bons que tout ce qui est actuellement disponible, sinon mieux."
Dans l'étude, les chercheurs en ont utilisé 10, 400 images pour entraîner leur modèle à prédire les niveaux locaux de PM2,5 en utilisant uniquement des images satellite et des conditions météorologiques. Ils ont testé leur modèle résultant sur 2 autres, 622 images pour voir à quel point il pouvait prédire les PM2,5.
Ils montrent que, en moyenne, leur modèle est précis à 24 % des niveaux réels de PM2,5 mesurés aux stations de référence, qui se situe dans le haut du spectre pour ces types de modèles, tout en ayant une résolution spatiale beaucoup plus élevée. Alors que la plupart des pratiques standard actuelles peuvent prédire des niveaux jusqu'à 1 million de mètres carrés, la nouvelle méthode est précise jusqu'à 40, 000—environ la taille de huit terrains de football placés côte à côte.
Avec ce niveau de spécificité et de précision, Bergin pense que leur méthode ouvrira un large éventail de nouvelles utilisations pour de tels modèles.
"Nous pensons qu'il s'agit d'une énorme innovation dans la recherche par satellite de la qualité de l'air et que ce sera l'épine dorsale de nombreuses recherches à venir, " a déclaré Bergin. " Nous commençons déjà à obtenir des demandes de renseignements sur son utilisation pour voir comment les niveaux de PM2,5 vont changer une fois que le monde commencera à se remettre de la propagation de COVID-19. "