Crédit :Ozcan Lab @ UCLA
L'apprentissage en profondeur est l'une des méthodes d'apprentissage automatique à la croissance la plus rapide qui s'appuie sur des réseaux de neurones artificiels multicouches. Traditionnellement, des systèmes d'apprentissage en profondeur sont mis en œuvre pour être exécutés sur un ordinateur afin d'apprendre numériquement la représentation et l'abstraction des données, et effectuer des tâches avancées, comparable ou même supérieur à la performance des experts humains. Les récentes applications réussies de l'apprentissage en profondeur comprennent l'analyse d'images médicales, reconnaissance de la parole, la traduction de la langue, classement d'images, ainsi que d'aborder des tâches plus spécifiques, comme la résolution de problèmes d'imagerie inverse.
Contrairement aux implémentations traditionnelles de l'apprentissage profond, dans un article récent publié dans Science , Des chercheurs de l'UCLA ont introduit un mécanisme physique pour mettre en œuvre un apprentissage en profondeur à l'aide d'un réseau de neurones profonds diffractifs entièrement optiques (D2NN). Ce nouveau cadre se traduit par des structures imprimées en 3D, conçu par le deep learning, qui se sont avérés capables d'effectuer avec succès différents types de tâches de classification et d'imagerie sans l'utilisation d'aucune puissance, sauf le faisceau lumineux d'entrée. Ce réseau de neurones profonds tout optique peut effectuer, à la vitesse de la lumière, diverses fonctions complexes que les réseaux de neurones informatiques peuvent mettre en œuvre, et trouvera des applications dans l'analyse d'images tout optique, détection de caractéristiques et classification d'objets, permettant également de nouvelles conceptions de caméras et composants optiques qui peuvent apprendre à effectuer des tâches uniques.
Cette recherche a été dirigée par le Dr Aydogan Ozcan, le Chancellor's Professor de génie électrique et informatique à l'UCLA et un HHMI Professor au Howard Hughes Medical Institute.
Les auteurs ont validé l'efficacité de cette approche en créant des réseaux diffractifs imprimés en 3D qui ont réussi à résoudre des problèmes d'échantillons, telles que la classification des images de chiffres manuscrits (de 0 à 9) et de produits de mode ainsi que la réalisation de la fonction d'une lentille d'imagerie à spectre térahertz.
« En utilisant des composants passifs fabriqués couche par couche, et la connexion de ces couches les unes aux autres par diffraction de la lumière a créé une plate-forme tout optique unique pour effectuer des tâches d'apprentissage automatique à la vitesse de la lumière, " a déclaré le Dr Ozcan. En utilisant des données d'image, les auteurs ont conçu des dizaines de milliers de pixels à chaque couche qui, avec les autres couches, effectuer collectivement la tâche pour laquelle le réseau a été formé. Après sa formation, qui se fait à l'aide d'un ordinateur, la conception est imprimée en 3D ou fabriquée pour former un empilement de couches qui utilisent la diffraction optique pour exécuter la tâche apprise.
En plus des tâches de classification d'images que les auteurs ont démontrées à l'aide de chiffres manuscrits et de produits de mode, cette architecture de réseau de neurones diffractifs a également été utilisée pour concevoir une lentille multicouche qui fonctionne au spectre térahertz, créer une image d'un objet d'entrée arbitraire en sortie du réseau, sans aucune compréhension des lois physiques associées à la formation d'images. Une telle conception a été créée en utilisant uniquement des données d'image qui ont été utilisées pour former les valeurs de pixels sur différentes couches pour former un système d'imagerie sous la forme d'un réseau diffractif.
Ce travail de preuve de concept met en évidence certaines opportunités uniques que permet l'apprentissage en profondeur pour la conception de composants optiques basée sur des données d'image, plutôt que des principes physiques ou une intuition technique. Sur la base de cette nouvelle approche, des composants optiques plus avancés peuvent être conçus sur la base de données, dépassant potentiellement les performances des composants traditionnels.
Les autres auteurs de cet ouvrage, tous de la UCLA Samueli School of Engineering, inclure les chercheurs postdoctoraux Xing Lin; Yair Rivenson, et Nezih T. Yardimci ; les étudiants diplômés Muhammed Veli et Yi Luo; et Mona Jarrahi, Professeur de génie électrique et informatique à l'UCLA.
Ce travail a été soutenu par NSF et HHMI.