Crédit :CC0 Domaine public
La difficulté et le coût de la collecte d'échantillons d'eau de rivière dans des régions éloignées ont entraîné d'importants - et dans certains cas, des décennies - des lacunes dans les données disponibles sur la chimie de l'eau, selon une équipe de chercheurs dirigée par Penn State. L'équipe utilise l'intelligence artificielle (IA) pour prédire la qualité de l'eau et combler les lacunes dans les données. Leurs efforts pourraient conduire à une meilleure compréhension de la façon dont les rivières réagissent aux perturbations humaines et au changement climatique.
Les chercheurs ont développé un modèle qui prévoit l'oxygène dissous (OD), un indicateur clé de la capacité de l'eau à soutenir la vie aquatique, dans des bassins hydrographiques peu surveillés à travers les États-Unis. Ils ont publié leurs résultats dans Sciences et technologies de l'environnement .
Généralement, la quantité d'oxygène dissous dans les rivières et les ruisseaux reflète leurs écosystèmes, car certains organismes produisent de l'oxygène tandis que d'autres en consomment. DO varie également en fonction de la saison et de l'altitude, et les conditions météorologiques locales de la région provoquent des fluctuations, trop, selon Li Li, professeur de génie civil et environnemental à Penn State.
"Les gens pensent généralement à DO comme étant entraîné par des processus biologiques et géochimiques des cours d'eau, comme les poissons respirant dans l'eau ou les plantes aquatiques faisant du DO les jours ensoleillés, " a dit Li. "Mais la météo peut aussi être un facteur important. Conditions hydrométéorologiques, y compris la température et la lumière du soleil, influencent la vie dans l'eau, et cela influence à son tour les niveaux de concentration d'OD."
Données hydrométéorologiques, qui suit comment l'eau se déplace entre la surface de la Terre et l'atmosphère, est enregistré beaucoup plus fréquemment et avec une plus grande couverture spatiale que les données sur la chimie de l'eau, selon Wei Zhi, chercheur postdoctoral au Département de génie civil et environnemental et premier auteur de l'article. L'équipe a émis l'hypothèse qu'une base de données hydrométéorologique nationale, qui comprendrait des mesures comme la température de l'air, les précipitations et le débit du cours d'eau, pourrait être utilisé pour prévoir les concentrations d'OD dans les régions éloignées.
« Il y a beaucoup de données hydrométéorologiques disponibles, et nous voulions voir s'il y avait suffisamment de corrélation, même indirectement, faire une prédiction et aider à combler les lacunes dans les données sur la chimie de l'eau des rivières, " dit Zhi.
Le modèle a été créé via un cadre d'IA connu sous le nom de réseau de mémoire à long court terme (LSTM), une approche utilisée pour modéliser les systèmes naturels de "stockage et libération", selon Chaopeng Shen, professeur agrégé de génie civil et environnemental à Penn State.
"Pensez-y comme une boîte, " dit Shen. " Il peut prendre de l'eau et la stocker dans un réservoir à certains taux, tandis que de l'autre côté le libérant à des rythmes différents, et chacun de ces taux est déterminé par la formation. Nous l'avons utilisé dans le passé pour modéliser l'humidité du sol, débit de pluie, température de l'eau et maintenant, FAIRE."
Les chercheurs ont reçu des données de la base de données hydrologiques Catchment Attributes and Meteorology for Large-Sample Studies (CAMELS), qui comprenait un ajout récent de données sur la chimie de l'eau des rivières de 1980 à 2014 pour les bassins hydrographiques peu perturbés. Sur les 505 bassins versants inclus dans le jeu de données « CAMELS-chem », l'équipe en a trouvé 236 avec le minimum nécessaire de dix mesures de concentration d'OD sur une période de 35 ans.
Pour former le réseau LSTM et créer un modèle, ils ont utilisé des données sur les bassins versants de 1980 à 2000, y compris les concentrations d'OD, mesures hydrométéorologiques quotidiennes et attributs des bassins versants comme la topographie, l'occupation du sol et la végétation.
Selon Zhi, l'équipe a ensuite testé la précision du modèle par rapport aux données DO restantes de 2001 à 2014, constatant que le modèle avait généralement appris la dynamique de la solubilité de l'OD, y compris la façon dont l'oxygène diminue dans les températures de l'eau plus chaudes et à haute altitude. Il s'est également avéré avoir une forte capacité prédictive dans près des trois quarts des cas de test.
"C'est un outil vraiment puissant, " a déclaré Zhi. "Cela nous a surpris de voir à quel point le modèle a appris la dynamique de l'OD dans de nombreuses conditions de bassin versant à l'échelle continentale."
Il a ajouté que le modèle fonctionnait mieux dans les zones avec des niveaux d'OD plus stables et des conditions d'écoulement d'eau stables, mais davantage de données seraient nécessaires pour améliorer les capacités de prévision pour les bassins versants avec une plus grande variabilité d'OD et de débit.
"Si nous pouvons collecter plus d'échantillons qui capturent les pics élevés et les creux faibles des niveaux d'oxygène dissous, nous pourrons refléter cela dans le processus de formation et améliorer les performances à l'avenir, " dit Zhi.