A partir des données (points) fournies au robot scientifique, il est capable de trouver la loi qui les décrit le mieux (surface bleue) et leur expression mathématique exacte. Crédit :URV
Il est désormais possible de prédire qui est le meilleur candidat pour recevoir une greffe d'organe, savoir si les clients d'une banque restitueront les prêts qu'ils demandent, choisir les films qui correspondent le mieux aux intérêts des consommateurs, ou même sélectionner le partenaire idéal de quelqu'un. Les algorithmes mathématiques analysent en permanence des millions de données, identifier des modèles et faire des prédictions sur tous les domaines de la vie. Mais dans la plupart des cas, les résultats ne donnent guère plus qu'une prédiction fermée qui ne peut être interprétée et qui est souvent affectée par des biais dans les données originales.
Maintenant, une équipe du groupe de recherche SEES:lab du Département de génie chimique de l'Universitat Rovira I Virgili et ICREA a fait une percée avec le développement d'un nouvel algorithme qui fait des prédictions plus précises et génère des modèles mathématiques qui permettent également de comprendre ces prédictions. Les résultats de cette recherche viennent d'être publiés dans la revue Avancées scientifiques .
"Le but de notre étude était de créer ce qu'on appelle un robot scientifique, un algorithme qui peut appliquer les connaissances et l'expertise dont un chercheur dispose pour interpréter les données, " explique Marta Sales-Pardo, l'un des auteurs de l'article. Les résultats fournis par l'algorithme sont caractérisés par le fait qu'ils sont interprétables. "C'est comme si quelqu'un avait élaboré une loi ou une théorie sur le système qu'on étudie. L'algorithme vous donne les relations mathématiques entre les variables qu'il a analysées et il le fait de manière totalement indépendante, " ajoute Roger Guimerà, un chercheur ICREA du même groupe.
Lorsqu'une entreprise dispose d'une énorme quantité de données qu'elle souhaite exploiter, il peut le faire en employant quelqu'un pour essayer différents modèles, proposer des formules et trouver celle qui fonctionne le mieux en réalisant des expériences pour les valider. Cela conduira à une formule mathématique qui permet de modéliser le système mais cela implique un investissement considérable en temps et en argent.
Une autre possibilité est de trouver un spécialiste en machine learning, une discipline scientifique dans le domaine de l'intelligence artificielle qui crée des systèmes qui identifient des modèles complexes dans d'énormes ensembles de données, apprendre automatiquement et produire un modèle « boîte noire » qui peut faire des prédictions. Cependant, ces systèmes ne fournissent aucune autre information et si la prédiction échoue, il est impossible de savoir où se trouve l'erreur et ce qui doit être fait pour l'empêcher.
L'algorithme développé à l'URV prend le meilleur des deux cas :il traite les données automatiquement, rapidement et de manière fiable, comme le fait le système d'apprentissage automatique, et il produit également un résultat qui est un modèle interprétable.
L'algorithme peut être utilisé pour analyser et interpréter les données de n'importe quelle discipline dans un processus beaucoup plus agile et efficace que ceux qui existent à ce jour. Mais la vraie valeur ajoutée est l'information que le système fournit. "En médecine, par exemple, si vous devez prendre une décision sur la base de données, il est très important de comprendre pourquoi chaque décision a été prise et le risque de se tromper, " explique Guimerà. " Bien que l'algorithme ait également montré qu'il est très précis, la chose la plus importante est que vous puissiez comprendre les résultats parce que vous avez construit un scientifique de la machine qui, sans aucune connaissance préalable, peut prendre un ensemble de données et développer une théorie qui résout le problème posé, " ajoute Ignasi Reichardt, un autre chercheur de l'équipe.
Dans cette étude, l'algorithme a été appliqué à un problème fondamental de la physique des fluides avec la collaboration du groupe de recherche Expérimentation, Calcul et Modélisation en Mécanique des Fluides et Turbulence du Département de Génie Mécanique de l'URV.