Un nouveau modèle de réseau de neurones artificiels surpasse MaxEnt dans l'exemple de problème inverse

Comparaison des fonctions spectrales de départ A(ω) (traits pleins) avec le Aˆ(ω) prédit calculé en utilisant l'approche MaxEnt (traits pointillés oranges) et le modèle ANN proposé (traits pointillés bleus) à différents niveaux de bruit η pour trois exemples des fonctions de densité spectrale non présentes dans l'ensemble de données d'apprentissage. ANN se comporte aussi bien que MaxEnt à faible niveau de bruit mais se comporte bien mieux que MaxEnt à haut niveau de bruit. Crédit :EPFL

Simulations numériques, généralement basé sur des équations décrivant un modèle donné et sur des données initiales, sont appliqués dans un éventail toujours plus large de disciplines scientifiques pour approximer des processus à des points donnés dans le temps et dans l'espace. Avec des problèmes dits inverses, ces données critiques sont manquantes - les chercheurs doivent reconstruire des approximations des données d'entrée ou du modèle sous-jacent aux données observables afin de générer les prédictions souhaitées.

Bien que des techniques pour le faire existent déjà, ils sont mal définis, incapable d'attribuer des interprétations ou des valeurs uniques à un point donné. Par exemple, dans la méthode la plus couramment utilisée pour résoudre de tels problèmes, l'approche dite d'entropie maximale (MaxEnt), les connaissances préalables sont ajoutées en spécifiant une distribution par défaut qui correspond aux résultats attendus en l'absence de données. L'algorithme recherche itérativement une distribution qui maximise l'entropie par rapport à cette distribution par défaut tout en générant également une fonction proche des données existantes. L'approche comprend un paramètre utilisé pour peser l'importance relative entre l'entropie et les termes d'erreur. Il existe plusieurs méthodes pour le corriger qui donnent souvent des résultats différents lorsqu'elles sont appliquées dans la pratique.

Dans l'article Approche du réseau de neurones artificiels pour le problème de continuité analytique, QuanSheng Wu, un scientifique et Romain Fournier, un étudiant en master au C3MP de l'EPFL, dirigé par le professeur Oleg Yazyev, et son collègue le professeur Lei Wang de l'institut de physique de l'Académie chinoise des sciences présentent une approche d'apprentissage supervisé du problème. Basé sur un réseau de neurones artificiels (ANN)—très polyvalent grâce à une capacité à approximer des fonctions continues sous des hypothèses modérées et grâce à de puissantes bibliothèques permettant la mise en œuvre efficace de différentes architectures ANN qui peuvent être adaptées pour tirer parti des structures de données—le nouveau La méthode semble être aussi précise que MaxEnt et considérablement moins chère en termes de calcul.

Dans un premier test du framework ANN, les chercheurs ont choisi d'examiner un système qui a une solution analytique, mais est difficile à résoudre en utilisant MaxEnt, à savoir, la fonction de corrélation temporelle de l'opérateur de position pour un oscillateur harmonique couplé linéairement à un environnement idéal. L'Hamiltonien, ou opérateur correspondant généralement à l'énergie totale du système, est connu dans ce cas, et les données d'intérêt - la fonction de corrélation en temps imaginaire - peuvent être générées par des simulations de Monte Carlo quantique (QMC).

La solution analytique donne la relation du spectre de puissance à une fonction de corrélation en temps imaginaire et, en tant que telle, a fourni des données d'entraînement physiquement pertinentes pour le modèle ANN. Les chercheurs ont formé l'ANN avec les données générées, puis l'ont testé en obtenant la fonction de corrélation en temps imaginaire calculée à l'étape précédente par QMC. Le modèle formé sur l'ensemble de données a montré un accord presque parfait avec la solution analytique. MaxEnt n'a pas réussi à donner des résultats précis, bien que les chercheurs aient noté que de meilleurs résultats auraient probablement été obtenus en calculant la fonction de corrélation sur un plus grand nombre de points.

Pour tester davantage le modèle de manière pratique, les chercheurs ont cherché à récupérer la densité spectrale d'une seule particule électronique dans le domaine fréquentiel réel à partir d'une fonction de Green dans le domaine temporel imaginaire. Alors que les modèles ANN et MaxEnt étaient capables de prédire avec précision les fonctions spectrales de départ pour le niveau de bruit le plus bas, MaxEnt avait tendance à supprimer les pics dans la fonction spectrale prédite avec l'augmentation du bruit dans le système. Ces résultats montrent que le modèle ANN est polyvalent et robuste contre les données bruitées.

La nouvelle méthode est également plus efficace sur le plan informatique. ANN a permis une cartographie directe entre les fonctions de Green et les densités spectrales et peut en ce sens résoudre le problème directement. MaxEnt, quant à lui, est itératif et génère des fonctions d'essai jusqu'à ce que la convergence soit atteinte. Avec la configuration informatique utilisée dans le document, le temps nécessaire pour convertir un nombre donné de paires à un niveau de bruit donné était de 5 secondes dans le cas d'ANN comparé aux 51 minutes que MaxEnt aurait eues en utilisant la même configuration.

Les chercheurs ont déclaré que de tels ANN sont susceptibles de résoudre d'autres problèmes inverses, à condition que les ensembles de données pertinents—dérivés, par exemple, en utilisant les résultats expérimentaux disponibles combinés à des techniques d'augmentation des données, peut être construit. Les modèles entraînés résultant du travail peuvent être obtenus à partir d'un référentiel public sur GitHub ici :github.com/rmnfournier/ACANN.

Métasurface de codage de type transmission à large bande pour la formation et le balayage de faisceaux électromagnétiques

Dans les ondes acoustiques, les ingénieurs rompent la réciprocité avec des métamatériaux variant dans l'espace-temps

Physique