(a) Le principe général de l'Anticipated Learning Machine (ALM). L'attracteur observé, un attracteur à retard et des attracteurs sans retard échantillonnés sont tous topologiquement conjugués. Chaque attracteur sans retard échantillonné préserve les informations dynamiques du système de différentes manières. En intégrant les informations contenues dans ces attracteurs sans retard échantillonnés, nous pourrions trouver une carte précise un à un même en cas de détérioration du bruit. (b) Anticipated Learning Machine. Pour chaque valeur future, ces cartes sont co-entraînées en une carte unifiée . Lorsque les cartes sont entraînées, la somme pondérée est utilisée comme prédiction. La valeur prédite est ensuite utilisée comme étiquette lors de l'apprentissage d'autres cartes pour prédire le prochain point dans le temps. Clairement, ALM Ψ transforme l'entrée spatiale X(tm) en sortie temporelle Z(tm) en chaque point tm. Crédit :©Science China Press
Faire une prédiction précise basée sur les données observées, en particulier à partir de séries temporelles à court terme, est très préoccupant dans diverses disciplines - de la biologie moléculaire, neurosciences, géosciences, et l'économie aux sciences de l'atmosphère—en raison de la disponibilité des données ou de la non-stationnarité variable dans le temps. Cependant, la plupart des méthodes existantes nécessitent des mesures suffisamment longues de séries temporelles ou d'un grand nombre d'échantillons, et il n'y a pas de méthode efficace disponible pour la prédiction avec des séries temporelles à court terme en raison du manque d'informations.
Pour résoudre ce problème, Prof. Chen Luonan (Institut de biochimie et de biologie cellulaire, Académie chinoise des sciences) avec le Dr Chen Chuan (Université Sun Yat-sen), Le professeur Ma Huanfei (Université de Soochow) et le professeur Aihara Kazuyuki (Université de Tokyo) ont proposé une nouvelle méthode dynamique basée sur les données, machine à apprentissage anticipé (ALM), pour réaliser des prévisions précises de l'état futur basées sur des données à court terme mais de grande dimension. L'ALM est un réseau de neurones multicouches où les variables de grande dimension sont considérées comme des neurones d'entrée (plusieurs variables mais à un moment donné) mais une variable cible est considérée comme des neurones de sortie (une seule variable mais à plusieurs moments). De cette façon, L'ALM est capable de transformer les informations récentes de corrélation/spatiale de variables de grande dimension en informations dynamiques/temporelles futures de toute variable cible, c'est-à-dire par des équations de transformation de l'information spatio-temporelle (STI).
Spécifiquement, L'ALM peut être bien entraîné pour représenter la carte d'inclusion distribuée aléatoirement (RDE) pour les équations STI par un grand nombre d'échantillons d'apprentissage générés avec le schéma Dropout et le schéma d'entraînement cohérent proposé, prédisant ainsi la variable cible de manière précise et robuste, même à partir de données à court terme. Des expériences approfondies sur les données de grande dimension à court terme provenant de systèmes synthétiques et réels ont démontré des performances significativement supérieures de l'ALM par rapport aux méthodes existantes.
Par rapport aux réseaux de neurones traditionnels (ou à d'autres approches d'apprentissage automatique) qui fouillent les statistiques historiques du système à haute dimension d'origine et nécessitent donc un grand nombre d'échantillons, L'ALM reconstruit de manière efficace et robuste sa dynamique même avec un petit nombre d'échantillons en se limitant à un espace de faible dimension, ce qui est en fait une propriété inhérente à un tel système dissipatif. Basé sur une dynamique non linéaire pour transformer l'information spatiale de toutes les variables de grande dimension mesurées en l'évolution temporelle de la variable cible en apprenant les équations STI, ALM ouvre une nouvelle voie pour l'apprentissage automatique basé sur la dynamique ou l'apprentissage anticipé « intelligent ».
"Comment considérer la forte non-linéarité ou/et la stochasticité des systèmes dynamiques également avec les données bruitées observées, et en outre, comment faire une analyse théorique plus approfondie et développer davantage un cadre approprié prenant ces questions en considération reste un problème ouvert et intéressant à l'avenir, " précisent les auteurs.