Crédit :CC0 Domaine public
Les causes des problèmes réels en économie et en santé publique peuvent être notoirement difficiles à déterminer. Souvent, plusieurs causes sont suspectées, mais les grands ensembles de données avec des données chronologiques ne sont pas disponibles. Les modèles précédents ne pouvaient pas analyser de manière fiable ces défis. Maintenant, les chercheurs ont testé le premier modèle d'intelligence artificielle pour identifier et classer de nombreuses causes dans des problèmes du monde réel sans données chronologiques, en utilisant une structure causale multi-nodale et des graphes acycliques dirigés.
Quand quelque chose de mauvais arrive, il est naturel d'essayer de comprendre pourquoi cela s'est produit. Qu'est-ce qui l'a causé ? Si la cause est déterminée, il peut être possible d'éviter le même résultat la prochaine fois. Cependant, certaines des façons dont les humains essaient de comprendre les événements, comme le recours à la superstition, ne peut pas expliquer ce qui se passe réellement. La corrélation non plus, ce qui peut seulement dire que l'événement B s'est produit à peu près au même moment que l'événement A.
Pour vraiment savoir ce qui a causé un événement, nous devons examiner la causalité – comment l'information circule d'un événement à un autre. C'est le flux d'informations qui montre qu'il existe un lien de causalité – que l'événement A a causé l'événement B. Mais que se passe-t-il lorsque le flux d'informations chronologiques de l'événement A à l'événement B est manquant ? Une causalité générale est requise pour identifier les causes.
Les modèles mathématiques de causalité générale ont été très limités, travailler pour jusqu'à deux causes. Maintenant, dans une percée en intelligence artificielle, les chercheurs ont développé le premier modèle robuste de causalité générale qui identifie plusieurs connexions causales sans données chronologiques, le modèle de bruit additif multivarié (MANM).
Des chercheurs de l'Université de Johannesburg, Afrique du Sud, et Institut national de technologie Rourkela, Inde, développé le modèle et l'a testé sur simulé, ensembles de données du monde réel. La recherche est publiée dans la revue Les réseaux de neurones .
« Uniquement, le modèle peut identifier plusieurs, facteurs de causalité hiérarchiques. Il fonctionne même si les données avec séquencement temporel ne sont pas disponibles. Le modèle crée des opportunités significatives pour analyser des phénomènes complexes dans des domaines tels que l'économie, flambées de maladies, changement climatique et conservation, " dit le Pr Tshilidzi Marwala, professeur d'intelligence artificielle, et expert mondial en IA et en économie à l'Université de Johannesburg, Afrique du Sud.
« Le modèle est particulièrement utile au niveau régional, niveau national ou mondial où aucune expérimentation contrôlée ou naturelle n'est possible, " ajoute Marwala.
Superstition et corrélation vers la causalité
"Si un chat noir traverse la route, ou une chouette hulule sur un toit, certaines personnes sont convaincues que quelque chose de vraiment grave va se produire. Une personne peut penser qu'il y a un lien entre voir le chat ou le hibou et ce qui s'est passé par la suite. Cependant, du point de vue de l'intelligence artificielle, on dit qu'il n'y a pas de lien de causalité entre le chat, Le hibou, et ce qui arrive aux gens qui les voient. Le chat ou la chouette ont été aperçus juste avant l'événement, mais ils sont simplement corrélés dans le temps avec ce qui s'est passé plus tard, " dit le Pr Marwala.
Pendant ce temps, à l'intérieur de la maison où le hibou a été aperçu, quelque chose de plus sinistre peut se passer. La famille à l'intérieur peut s'endetter de plus en plus. Une telle situation financière peut imposer des restrictions sévères au ménage, devenant finalement un piège dont il y a peu d'échappatoire. Mais les gens qui y vivent comprennent-ils les liens de causalité réels entre ce qui leur arrive, ce qu'ils font, et leur niveau d'endettement ?
Causalité au niveau du ménage
Les causes de l'endettement persistant des ménages sont un bon exemple de ce dont est capable le nouveau modèle, dit le chercheur post-doctoral Dr Pramod Kumar Parida, auteur principal de l'article de recherche.
« Au niveau du ménage, on peut se demander :le ménage a-t-il perdu une partie ou la totalité de ses revenus ? Certains ou tous les membres dépensent-ils au-delà de leurs revenus ? tels que les factures médicales ou d'invalidité? Utilisent-ils leur épargne ou leurs investissements, qui sont maintenant épuisés ? Est-ce qu'une combinaison de ces choses se produit, si c'est le cas, quelles sont les causes les plus dominantes de la dette ? »
Si suffisamment de données sur les transactions financières du ménage sont disponibles, complet avec les informations de date et d'heure, il est possible pour quelqu'un de comprendre les liens de causalité réels entre le revenu, dépenser, des économies, investissements et endettement.
Dans ce cas, une simple théorie de la causalité est suffisante pour découvrir pourquoi ce ménage est en difficulté.
Causalité générale au niveau sociétal
Mais, dit Parida, « Quelles sont les vraies raisons pour lesquelles la plupart des habitants d'une ville ou d'une région éprouvent des difficultés financières ? Pourquoi ne se désendettent-ils pas ? » Maintenant, il n'est plus possible pour une équipe de personnes de le deviner à partir des données disponibles, et un tout nouveau défi mathématique s'ouvre.
"Surtout si vous voulez les liens de causalité réels entre le revenu du ménage, dépenser, épargne et endettement pour la ville ou la région, plutôt que des suppositions d'experts ou "ce que la plupart des gens croient, "" il ajoute.
"Ici, la théorie de la causalité échoue, car les données sur les transactions financières des ménages de la ville ou de la région seront incomplètes. Aussi, les informations de date et d'heure seront manquantes pour certaines données. Lutte financière en bas, les ménages à revenu moyen et élevé peuvent être très différents, vous voudrez donc voir les différentes causes à partir de l'analyse, " dit Parida.
"Avec ce modèle, que vous pouvez identifier peut identifier plusieurs facteurs déterminants majeurs à l'origine de l'endettement des ménages. Dans le modèle, nous appelons ces facteurs les connexions causales parentales indépendantes. Vous pouvez également voir quelles connexions causales sont plus dominantes que les autres. Avec un deuxième passage dans les données, vous pouvez également voir les facteurs de conduite mineurs, ce que nous appelons les connexions causales de l'enfant indépendant. De cette façon, il est possible d'identifier une hiérarchie possible de connexions causales."
Analyse causale considérablement améliorée
Le modèle de bruit additif multivarié (MANM) fournit une analyse causale nettement meilleure sur des ensembles de données du monde réel que les modèles standard de l'industrie actuellement utilisés, déclare le co-auteur, le professeur Snehashish Chakraverty, au Groupe de Mathématiques Appliquées, Département de mathématiques, Institut national de technologie Rourkela, Inde.
"Afin d'améliorer un problème régional complexe tel que l'endettement des ménages ou les problèmes de santé, il peut ne pas être suffisant d'avoir la connaissance des tendances de la dette, ou de la maladie et de l'exposition. Au contraire, nous devrions comprendre pourquoi de tels modèles existent, pour avoir la meilleure façon de les changer. Les modèles précédents développés par les chercheurs fonctionnaient avec un maximum de deux facteurs causaux, c'est-à-dire qu'il s'agissait de modèles bivariés, qui n'a tout simplement pas pu trouver plusieurs critères de dépendance de fonctionnalités, " il dit.
Graphes acycliques dirigés
"MANM est basé sur des graphes acycliques dirigés (DAG), qui peut identifier une structure causale multi-nodale. MANM peut estimer toutes les directions causales possibles dans des ensembles de caractéristiques complexes, sans aucune direction manquante ou erronée."
L'utilisation de DAG est l'une des principales raisons pour lesquelles MANM surpasse considérablement les modèles précédemment développés par d'autres, qui étaient basées sur l'analyse en composantes indépendantes (ICA), tels que le modèle acyclique non gaussien linéaire (ICA-LiNGAM), Recherche DAG gourmande (GDS) et régression avec test indépendant sous-séquent (RESIT), il dit.
"Une autre caractéristique clé de MANM est le facteur d'influence causale (CIF) proposé, pour la découverte réussie des directions causales dans le système multivarié. Le score CIF fournit un indicateur fiable de la qualité de l'inférence fortuite, ce qui permet d'éviter la plupart des directions manquantes ou erronées dans la structure causale résultante, " conclut Chakraverty.
Lorsqu'un ensemble de données existant est disponible, MANM permet maintenant d'identifier plusieurs structures causales multi-nodales au sein de l'ensemble. Par exemple, MANM peut identifier les causes multiples de l'endettement persistant des ménages ménages à revenu moyen et élevé dans une région.