L'approche INLA développée par Rue et ses collègues a été utilisée dans le Malaria Atlas Project (MAP), qui diffuse gratuitement, précis, des informations à jour sur le paludisme, vise à limiter la propagation de la maladie. Crédit :PROJET ATLAS DU PALUDISME
Les outils développés par Håvard Rue ont transformé l'analyse des données, interprétation et communication, et sont largement appliqués :de la modélisation de la propagation des maladies infectieuses à la cartographie des stocks de poissons.
La statistique est la science de l'apprentissage à partir des données, avec des statisticiens fournissant des informations précieuses sur les problèmes les plus urgents auxquels l'humanité est confrontée, tels que les impacts sanitaires de la pollution sur la propagation des maladies infectieuses.
Les chercheurs doivent comprendre les statistiques s'ils veulent prendre des décisions éclairées.
« Fournir aux scientifiques les outils nécessaires pour mieux comprendre les problèmes du monde réel signifie que les décideurs ont accès à des données fiables pour prendre des décisions importantes qui affectent de nombreux aspects de la vie, de la santé et de l'environnement à l'économie et aux questions sociales, " explique Håvard Rue, professeur de statistiques à la KAUST.
Rue est un pionnier dans le domaine des statistiques bayésiennes computationnelles, une méthode qui applique des probabilités à des problèmes statistiques, conduisant à des prédictions plus rapides et plus précises. Ses travaux portent sur l'application des approximations de Laplace imbriquées intégrées (INLA), une approche pour entreprendre l'inférence bayésienne qui met à jour les conclusions tirées des modèles statistiques à la lumière de nouvelles données.
"Les principaux problèmes de la modélisation bayésienne sont la vitesse et la précision, " explique Rue. " Normalement, il faut troquer la vitesse contre la précision, mais avec INLA vous obtenez les deux. C'est presque trop beau pour être vrai."
L'approche INLA représente une manière différente d'analyser des ensembles de données de grande dimension contenant des milliers de mesures, telles que celles utilisées pour la modélisation du climat ou la prévision des modèles météorologiques, et est trop complexe pour des méthodes telles que l'échantillonnage Monte Carlo par chaîne de Markov, qui sont chronophages et peu pratiques pour les très grands modèles.
Pour aider à appliquer la méthode statistique INLA et mieux analyser des ensembles de données de plus en plus volumineux, Rue et ses collègues ont développé le progiciel statistique R-INLA, qui permet l'application INLA dans divers domaines, de la santé à l'écologie.
Par exemple, Gavin Shaddick, professeur de Data Science and Statistics à l'Université d'Exeter au Royaume-Uni, utilisé R-INLA pour analyser une base de données contenant des données de plus de 4, 300 villes dans plus de 100 pays pour modéliser les impacts sur la santé et l'environnement de la pollution de l'air.
"La pollution de l'air est un facteur de risque majeur pour la santé mondiale avec 4,2 millions de décès chaque année attribués à la pollution par les particules fines, " dit Shaddick. " Sans R-INLA, nous n'aurions pas pu effectuer ces analyses à l'échelle mondiale. "
L'oeuvre, en collaboration avec l'Organisation mondiale de la santé (OMS), a montré que 92 pour cent de la population mondiale réside dans des zones dépassant les directives de l'OMS pour la qualité de l'air.
La méthode a également été utilisée par le Malaria Atlas Project (MAP), qui diffuse gratuitement, précis, des informations à jour sur le paludisme, et vise à limiter la propagation de la maladie. Selon le Rapport mondial sur le paludisme de l'OMS 2017, on estime que 216 millions de cas de paludisme sont survenus dans le monde en 2016, une augmentation d'environ 5 millions de cas par rapport à l'année précédente.
"Avant R-INLA s'il n'était pas possible d'effectuer des inférences pour plus d'un millier d'observations, ce qui en fait un outil important pour comprendre la propagation du paludisme, " dit, Samir Bhatt de l'Imperial College Public School of Health à Londres, ROYAUME-UNI., qui a utilisé le R-INLA pour modéliser la prévalence de différentes formes de paludisme à l'échelle mondiale.
Le Center for Disease Control and Prevention (CDC) utilise également R-INLA pour cartographier le nombre croissant de suicides aux États-Unis, fournir un niveau de détail sans précédent en permettant des changements dans les taux de suicide dans plus de 3, 000 comtés à suivre de 2005 à 2015.
« La compréhension des tendances géographiques des taux de suicide nous aide à déterminer quels pays signalent des taux élevés et ont besoin de ressources de prévention du suicide, " explique Diba Khan, Senior Service Fellow aux Centers for Disease Control and Prevention (CDC). "En utilisant INLA, les agences de santé publique locales sont en mesure d'allouer des fonds pour obtenir des résultats de santé impossibles à partir des seules données au niveau de l'État. »
La méthode INLA a également été appliquée par des chercheurs de l'Université catholique de Valparaíso pour cartographier les schémas de distribution des crevettes au large des côtes chiliennes. Il leur a permis d'identifier les zones où la pêche est possible et de faire des recommandations sur les quotas de capture pour aider à gérer les ressources halieutiques.
« Je suis toujours surpris de voir des applications de l'INLA dans des domaines dont je n'ai jamais entendu parler et qui sont en dehors des statistiques de base. Cela démontre que ce que nous faisons est important et a un impact sur la façon dont les gens travaillent avec les statistiques, " dit Rue.