Exemples d'installations porcines (à gauche) et avicoles (à droite), avec l'image originale (en haut) et une carte thermique de la façon dont les modèles algorithmiques ont traité l'image (en bas). Les zones rouges montrent où le modèle a détecté la probabilité d'emplacements d'installations. Crédit :Programme national d'imagerie agricole / Département de l'agriculture des États-Unis
Comment localiser les fermes animales potentiellement polluantes a longtemps été un problème pour les régulateurs environnementaux. Maintenant, Des chercheurs de Stanford montrent comment un algorithme de lecture de carte pourrait aider les régulateurs à identifier les installations plus efficacement que jamais.
Professeur de droit Daniel Ho, avec Ph.D. étudiante Cassandra Handan-Nader, ont trouvé un moyen d'apprentissage automatique - en enseignant à un ordinateur comment identifier et analyser les modèles de données - pour localiser efficacement les exploitations d'animaux industriels et aider les régulateurs à déterminer le risque environnemental de chaque installation. Les résultats des chercheurs devraient être publiés le 8 avril dans Durabilité de la nature .
"Notre travail montre comment une agence gouvernementale peut tirer parti des progrès rapides de la vision par ordinateur pour protéger plus efficacement l'eau potable, " dit Ho, le professeur de droit William Benjamin Scott et Luna M. Scott, et chercheur principal au Stanford Institute for Economic Policy Research.
Un problème de base, aux conséquences complexes
Selon l'Agence pour la protection de l'environnement (EPA), l'agriculture est le principal contributeur de polluants dans l'approvisionnement en eau de la nation, avec une pollution importante que l'on croit provenir de opérations d'alimentation animale concentrées, également connu sous le nom de CAFO.
Mais les efforts de surveillance environnementale ont été entravés par un problème fondamental :les régulateurs n'ont aucun moyen systématique de déterminer où se trouvent les CAFO, dit Ho. Le Government Accountability Office des États-Unis signale qu'aucun organisme fédéral ne dispose d'informations fiables sur le nombre, la taille et l'emplacement des exploitations agricoles à grande échelle.
Bien que la Loi sur l'assainissement de l'eau exige certains permis fédéraux, il ne s'applique qu'aux opérations qui rejettent réellement des polluants dans les cours d'eau américains - et non aux installations qui pourraient potentiellement causer une contamination - intentionnellement ou non, dit Ho.
Sans liste précise vers laquelle se tourner, les efforts de surveillance des installations potentiellement polluantes sont difficiles et, dans certains cas, impossible.
"Ce déficit d'information étouffe l'application des lois environnementales des États-Unis, " dit Ho.
Certains groupes environnementaux et d'intérêt public ont tenté d'identifier eux-mêmes les installations en scannant le terrain manuellement ou en regardant des photos aériennes, mais ils ont trouvé que c'était une tâche incroyablement chronophage. Il a fallu plus de trois ans à un groupe environnemental pour examiner les images d'un seul État. Des efforts de surveillance comme ceux-ci ne pourraient jamais s'étendre ou être effectués en temps réel, dit Ho.
Utiliser les mégadonnées pour combler les lacunes
Ho et Handan-Nader, puis chercheur à la Stanford Law School et poursuivant actuellement un doctorat en sciences politiques, ont tourné leur attention vers un type d'intelligence artificielle appelé apprentissage en profondeur. Un sous-ensemble de l'apprentissage automatique, les algorithmes d'apprentissage en profondeur ont révolutionné la capacité à détecter des objets complexes dans l'imagerie.
Avec l'aide de plusieurs outils open source et d'une équipe d'étudiants en économie et en informatique pour aider à l'analyse des données, Ho et Handan-Nader ont pu recycler un modèle de reconnaissance d'images existant pour reconnaître les installations animales à grande échelle en utilisant les informations collectées par deux groupes à but non lucratif et des images satellites accessibles au public du National Agricultural Imagery Program (NAIP) de l'USDA. Les chercheurs se sont concentrés sur l'identification des installations avicoles en Caroline du Nord, car la plupart ne sont pas tenues d'obtenir des permis, dit Ho.
Le modèle, déjà rompu à la numérisation d'images à partir d'un énorme corpus d'images numériques, a été recyclé pour relever des indices similaires que les organisations environnementales surveillaient manuellement. Par exemple, les fermes porcines étaient identifiables par des étables rectangulaires compactes attenantes à de grandes fosses à purin, et la volaille par de longues granges rectangulaires et un stockage de fumier sec. En se concentrant sur ces caractéristiques importantes, le modèle a également été en mesure de fournir des estimations de la taille des installations.
Les chercheurs ont découvert que leur algorithme était capable d'identifier 15% de fermes avicoles de plus que ce qui avait été trouvé à l'origine par des efforts manuels. Et parce que leur approche pouvait s'étendre sur des années d'imagerie NAIP, leur algorithme a pu estimer avec précision la croissance à proximité d'une meunerie récemment construite.
"Le modèle a détecté 93 pour cent de tous les CAFO de volaille dans la région, et était précis à 97 % pour déterminer ceux qui sont apparus après l'ouverture de la meunerie, " Handan-Nader et Ho écrivent dans le journal.
Complémentaire, approche interdisciplinaire
Ho et Handan-Nader espèrent que l'apprentissage automatique pourra compléter les efforts de surveillance humaine des agences environnementales et des groupes d'intérêt.
"Maintenant, toutes sortes de chercheurs avec des capacités de programmation peuvent exploiter ces outils open source pour de nouvelles applications, " dit Handan-Nader, un co-auteur sur le papier. « Vous pouvez vous tenir sur les épaules de géants et développer ce que les experts de ce type de techniques d'apprentissage automatique ont fait. »
L'utilisation de l'apprentissage automatique pour les tâches par cœur peut libérer les gens pour en faire des plus complexes, comme la détermination des risques environnementaux possibles d'une installation, dit Handan-Nader. Les chercheurs ont estimé que leur algorithme pourrait capturer 95 pour cent des installations à grande échelle existantes en utilisant moins de 10 pour cent des ressources nécessaires pour un recensement manuel.
Ho et Handan-Nader espèrent que, finalement, les progrès de l'imagerie aérienne permettront à un modèle informatique de détecter les rejets réels dans les cours d'eau.
"De plus en plus, les problèmes sociaux complexes ne peuvent être résolus à partir des limites d'une seule discipline étroite, et la capacité de tirer parti de l'innovation entre les campus peut aider à résoudre les principaux problèmes de droit et de politique publique, " dit Ho.