Figure 1 :Les caractéristiques dérivées des indicateurs sont ensuite transmises à un modèle qui génère des prévisions ainsi que des intervalles de confiance. Crédit :IBM
Les gouvernements du monde entier se sont réunis à Marrakech en décembre dernier pour ratifier un pacte visant à améliorer la coopération en matière de migration internationale. Entre autres objectifs, le Pacte mondial pour les migrations cherche à utiliser « des données précises et désagrégées comme base pour des politiques fondées sur des preuves ». Comment les technologies d'apprentissage automatique peuvent-elles aider à résoudre des problèmes de société profondément polarisants comme la migration ?
Début 2018, avec le soutien d'IBM Corporate Citizenship et du ministère danois des Affaires étrangères, IBM et le Conseil danois pour les réfugiés (DRC) se sont lancés dans un partenariat visant carrément à mieux comprendre les moteurs de la migration et des orientations politiques fondées sur des preuves pour un éventail de parties prenantes. Lors de la récente keynote de THINK Copenhagen, le Secrétaire Général de la RDC, Christian Friis Bach, présenté les premiers résultats de cet effort.
Si nous pouvons prévoir les flux migratoires et de réfugiés, nous pouvons empêcher et améliorer la protection des personnes en mouvement. Excellent partenariat avec @IBM sur la modélisation prédictive. Présentation des premiers résultats au #THINK2018CPH ! pic.twitter.com/x1JDyI8s6L
– Christian Friis Bach (@christianfbach) 7 novembre 2018
Dans ce billet, Je vais vous expliquer le développement d'un système d'apprentissage automatique qui fournit des prévisions stratégiques de migration mixte ainsi qu'une analyse de scénarios. La migration mixte fait référence aux mouvements transfrontaliers de personnes motivés par une multiplicité de facteurs pour se déplacer, y compris les réfugiés fuyant les persécutions et les conflits, victimes de la traite, et les personnes à la recherche d'une vie meilleure et d'opportunités. Ces populations ont une gamme de statuts juridiques, dont certains ne sont pas reflétés dans les statistiques officielles du gouvernement.
Comprendre la dynamique et les moteurs de la migration est intrinsèquement complexe. Les circonstances diffèrent d'une personne à l'autre. La question « pourquoi avez-vous décidé de déménager ? » n'est pas simple pour les gens de répondre. Cependant, dans la mesure où les décisions individuelles reflètent des facteurs sociétaux structurels, la dynamique peut s'expliquer en partie par des mesures agrégées. Par exemple, On peut s'attendre à ce que les moteurs économiques du mouvement soient liés aux opportunités d'emploi et donc aux macro-indicateurs sur l'emploi. Ces défis sont aggravés par la disponibilité des données et la couverture d'indicateurs spécifiques.
Le système de prévision
Nous avons commencé par tirer parti du programme de surveillance 4MI géré par la RDC à travers lequel des milliers de migrants en mouvement sont interrogés. L'analyse des données d'enquête révèle des grappes de haut niveau de moteurs de la migration. Ces groupes allaient de l'absence de droits et d'autres services sociaux, aux nécessités économiques et aux conflits. Ces moteurs sont ensuite mappés à des indicateurs quantitatifs. Les caractéristiques dérivées de ces indicateurs sont ensuite introduites dans un modèle qui génère des prévisions ainsi que des intervalles de confiance (Figure 1). En outre, le système génère également un contexte pour chaque prévision en affichant les facteurs spécifiques qui ont contribué à la prévision.
À l'aide de ces indicateurs, nous avons développé un modèle d'ensemble pour faire des prévisions stratégiques annuelles pour les flux bilatéraux sur les volumes de migrations mixtes annuellement. Nos évaluations montrent que les taux d'erreur se situent à quelques milliers de personnes par an, même pour les pays aux conditions volatiles. Le système permet en outre l'analyse de scénarios, où les changements relatifs des facteurs d'influence peuvent être modélisés pour faire des prédictions ajustées.
D'intéressantes dynamiques contre-intuitives émergent d'une telle analyse. Par exemple, les taux de chômage en Éthiopie sont supérieurs à la moyenne par rapport aux pays subsahariens. Un grand nombre d'Éthiopiens se rendent en Arabie saoudite pour le travail. L'augmentation des taux d'emploi jusqu'au meilleur cinquième de la région entraînera une plus grande migration vers le Royaume-Uni (augmentation de deux pour cent), Suède (augmentation de deux pour cent) et Arabie saoudite (augmentation de huit pour cent). Cela reflète une capacité et des moyens accrus des Éthiopiens de répondre à leurs aspirations à l'étranger. Si le chômage atteint les pires niveaux, le modèle prédit une augmentation de la migration vers l'Afrique du Sud (augmentation de trois pour cent) et l'Arabie saoudite (augmentation de quatre pour cent), avec des destinations de l'UE largement invariantes à l'augmentation du chômage.
Figure 2 :Matrice de corrélation pour toutes les caractéristiques considérées dans le modèle (pas d'effets temporels). Crédit :IBM
Une telle analyse quantitative détaillée n'était pas disponible auparavant pour les parties prenantes qui doivent formuler des réponses politiques.
Inférence causale
Le système de prévision décrit ci-dessus est purement axé sur les données et nous nous appuyons sur le modèle pour dériver les relations entre toutes les variables. Alternativement, si nous cherchons à exploiter l'expertise en la matière et à inclure des informations spécifiques dans le système, nous pourrions adopter l'approche des modèles graphiques probabilistes.
Lors d'un atelier organisé à IBM Research - Irlande, des experts en la matière du Centre des migrations mixtes à Genève et en RDC ont établi le réseau « spaghetti » montrant comment ils s'attendent à ce que les groupes d'indicateurs soient liés de manière causale. En utilisant ceci comme entrée, nous avons ensuite combiné leur opinion d'expert avec les données. Nous avons utilisé une technique appelée apprentissage de la structure pour développer un tel réseau.
Les prévisions utilisant de tels réseaux ne fonctionnent généralement pas aussi bien que les approches purement basées sur les données présentées ci-dessus ; néanmoins, ils aident à l'analyse de scénarios et à l'analyse des politiques.
Et après?
Figure 3 :(à gauche) réseau causal dessiné par des experts et (à droite) réseau appris sur la base de l'opinion d'experts et de preuves basées sur des données pour toute l'Afrique subsaharienne. Crédit :IBM
Ce sont les premières étapes vers un avenir où les décideurs politiques ont un accès instantané aux preuves quand et où elles sont nécessaires et où les relations complexes peuvent être explorées facilement pour fournir plus d'informations sur une meilleure politique.
Pour l'instant, nous continuons à améliorer le système et à recueillir les commentaires des utilisateurs avec des experts en la matière en RDC. Après validation plus détaillée, nous chercherons à étendre la portée géographique et les capacités d'analyse de scénarios.
Cette histoire est republiée avec l'aimable autorisation d'IBM Research. Lisez l'histoire originale ici.