Une nouvelle approche d'apprentissage automatique peut aider les chercheurs à résoudre des problèmes tels que la détermination des meilleures tailles de cylindres pour capturer l'énergie électromagnétique. Crédit:Duke University School of Nursing
Les ingénieurs électriciens de l'Université Duke ont mis au point une nouvelle méthode pour résoudre des problèmes de conception difficiles avec de nombreuses solutions potentielles dans un grand espace de conception en utilisant l'apprentissage automatique. Surnommée la "méthode neuronale-adjointe, " l'approche découvre avec succès une conception optimisée pour un dispositif de communication électromagnétique et pourrait également être utilisée pour de nombreux autres défis de conception allant de l'imagerie biomédicale à l'holographie.
La recherche est parue en ligne le 24 février dans le journal Optique Express , intitulé « Méthode neuronale-adjointe pour la conception inverse de métasurfaces entièrement diélectriques ».
Le dilemme abordé par la nouvelle méthode d'apprentissage automatique consiste à résoudre des problèmes inverses, ce qui signifie que les chercheurs connaissent le résultat qu'ils veulent mais ne sont pas sûrs de la meilleure façon d'y parvenir. Dans ce type de défi se trouve une classe appelée problèmes inverses mal posés, ce qui signifie qu'il existe un nombre infini de solutions sans aucune indication quant à celle qui pourrait être la meilleure.
"Si on vous donne deux nombres à additionner, vous pouvez obtenir une solution directe et simple, " a expliqué Willie Padilla, professeur de génie électrique et informatique à Duke. "Mais si je dis de me donner deux nombres réels qui font trois, il existe un ensemble infini de nombres qui pourraient être la réponse sans comprendre si la bonne réponse a été choisie. Retourner cette tâche simple montre à quel point un problème inverse mal posé peut être difficile."
Dans la nouvelle recherche, la tâche spécifique que Padilla cherche à résoudre est de trouver la meilleure conception pour un métamatériau diélectrique (sans métal) qui produit une réponse électromagnétique spécifique. Les métamatériaux sont des matériaux synthétiques composés de nombreuses caractéristiques techniques individuelles, qui ensemble produisent des propriétés qui ne se trouvent pas dans la nature. Ils y parviennent par leur structure plutôt que par leur chimie. Dans l'expérience de métamatériau diélectrique de Padilla, il utilise une grande feuille construite à partir de grilles individuelles deux par deux de cylindres de silicium ressemblant à des courts, Lego carré.
Calculer comment les effets électromagnétiques d'un ensemble identique de cylindres interagissent les uns avec les autres est un processus simple qui peut être effectué par un logiciel commercial. Mais résoudre le problème inverse mal posé de la géométrie qui produira le mieux un ensemble souhaité de propriétés est une proposition beaucoup plus difficile. Parce que chaque cylindre crée un champ électromagnétique qui s'étend au-delà de ses limites physiques, ils interagissent les uns avec les autres de manière imprévisible, manière non linéaire.
"Si vous essayez de créer une réponse souhaitée en combinant les effets électromagnétiques produits par chaque cylindre individuel, vous allez obtenir une carte compliquée de nombreux pics hauts et bas qui n'est pas simplement une somme de leurs parties, " a déclaré le professeur Padilla. " C'est un immense espace de paramètres géométriques et vous êtes complètement aveugle - il n'y a aucune indication de la direction à prendre. "
La nouvelle approche d'apprentissage automatique de Padilla pour naviguer dans cet espace de conception complexe commence par former un réseau neuronal profond avec 60, 000 simulations de différentes conceptions et des propriétés électromagnétiques qu'elles produisent. Même en tenant compte de 14 paramètres géométriques, l'algorithme d'apprentissage automatique a appris la fonction qui relie la géométrie complexe au résultat électromagnétique.
À ce point, le réseau de neurones profonds pourrait fournir aux chercheurs une réponse à une question inverse consistant à trouver une géométrie capable de produire une réponse souhaitée. Mais avec 1,04 billion de solutions potentielles, il faudrait au réseau de neurones plus de trois ans pour trouver une réponse.
"À ma connaissance, c'est le plus grand problème de photonique de l'espace géométrique sur lequel quelqu'un ait travaillé, " dit Padilla. " Si vous essayez de le résoudre avec un algorithme informatique normal, cela prendrait 600 millions d'années. Le réseau de neurones profonds n'a échantillonné que 0,00000575% de l'espace de conception, mais il a quand même appris la fonction."
Bien qu'un exploit impressionnant, c'est la deuxième étape de ce processus qui est vraiment nouveau. Bien que les chercheurs ne sachent pas exactement à quoi ressemble réellement la fonction du réseau de neurones profonds, ils peuvent l'utiliser pour travailler vers une réponse optimale.
La nouvelle méthode neuronale-adjointe fonctionne en commençant à 16, 000 points aléatoires et calcul de la qualité d'une solution. Cela permet ensuite à chacun de se diriger vers une meilleure solution, un processus appelé descente de gradient. En répétant ce processus plusieurs fois, l'algorithme se fraye un chemin vers des solutions optimisées localement. Surtout, les chercheurs ont également fixé des limites minimales et maximales en fonction de leur connaissance de l'espace dans lequel l'apprentissage automatique est précis, ce qui a empêché l'algorithme de devenir trop fou avec ses solutions.
Après 300 itérations, le programme regarde le 16, 000 solutions localement optimales qu'il trouve et choisit la meilleure option. Il indique également s'il pourrait y avoir une limite définie sur un paramètre qui pourrait permettre une meilleure solution s'il était étendu.
« En faisant cette recherche, nous avons vu toutes nos meilleures solutions bloquées par rapport à la hauteur maximale que nous avions fixée pour les cylindres, " a déclaré Padilla. "Nous nous limitions, mais nous ne le savions pas. Nous avons donc augmenté la hauteur, fait encore plus de simulations, et effectivement trouvé une meilleure solution."
Appliqué aux métamatériaux, Padilla dit que cette méthode pourrait aider à développer des antennes de communication plates pour les côtés des bâtiments qui peuvent se reconfigurer rapidement pour mieux atteindre les utilisateurs à proximité. Mais il dit qu'il pourrait également être utilisé dans un large éventail d'applications qui collectent des informations à partir d'ondes électromagnétiques. Par exemple, interpréter des rayons X ou des ondes magnétiques dans des appareils d'imagerie médicale ou développer des hologrammes générés par ordinateur.