Réseau de neurones optiques d'ingénierie appliqué à une tâche d'apprentissage automatique conventionnelle. Crédit:UCLA Engineering Institute for Technology Advancement
Le réseau de neurones profonds diffractifs est un cadre d'apprentissage automatique optique qui utilise des surfaces diffractives et de la matière conçue pour effectuer tous les calculs optiquement. Après sa conception et sa formation sur ordinateur utilisant des méthodes modernes de deep learning, chaque réseau est physiquement fabriqué, en utilisant par exemple l'impression 3D ou la lithographie, pour transformer le modèle de réseau formé en matière. Cette structure 3-D de matière artificielle est composée de surfaces transmissives et/ou réfléchissantes qui effectuent ensemble des tâches d'apprentissage automatique par le biais de l'interaction lumière-matière et de la diffraction optique, à la vitesse de la lumière, et sans besoin de puissance, à l'exception de la lumière qui éclaire l'objet d'entrée. Ceci est particulièrement important pour reconnaître les objets cibles beaucoup plus rapidement et avec beaucoup moins de puissance par rapport aux systèmes d'apprentissage automatique basés sur ordinateur standard, et pourrait offrir des avantages majeurs pour les véhicules autonomes et diverses applications liées à la défense, entre autres. Présenté par des chercheurs de l'UCLA [1], ce cadre a été validé expérimentalement pour la classification et l'imagerie d'objets, fournissant un cadre de calcul optique évolutif et économe en énergie. Dans les recherches suivantes, Les ingénieurs de l'UCLA ont encore amélioré les performances d'inférence des réseaux de neurones optiques diffractifs en les intégrant aux réseaux de neurones profonds numériques standard, former des modèles hybrides d'apprentissage automatique qui effectuent des calculs en partie à l'aide de la diffraction de la lumière à travers la matière et en partie à l'aide d'un ordinateur [2].
Dans leur dernier ouvrage, [3] publié dans Photonique avancée , une revue en libre accès de SPIE, la société internationale d'optique et de photonique, le groupe UCLA a pleinement profité de la capacité de parallélisation inhérente à l'optique, et a considérablement amélioré les performances d'inférence et de généralisation des réseaux de neurones optiques diffractifs (voir la figure), aider à combler l'écart entre les réseaux de neurones électroniques tout-optiques et standard. L'une des principales améliorations a incorporé un schéma de détection différentielle, où chaque score de classe au niveau du plan de sortie du réseau optique est calculé à l'aide de deux détecteurs différents, l'un représentant des nombres positifs et l'autre représentant des nombres négatifs. La classe d'objet correcte (par exemple voitures, avions, navires, etc.) est déduite par la paire de détecteurs qui présente la plus grande différence normalisée entre les détecteurs positifs et négatifs. Ce schéma de détection différentielle est également associé à des réseaux optiques diffractifs fonctionnant en parallèle, où chacun est spécialisé pour reconnaître spécifiquement un sous-groupe de classes d'objets. Cette conception de réseau diffractif spécifique à une classe bénéficie considérablement du parallélisme et de l'évolutivité des systèmes optiques, former des chemins lumineux parallèles au sein de la matière d'ingénierie 3D pour calculer séparément les scores de classe de différents types d'objets.
Ces nouvelles stratégies de conception ont atteint des niveaux de précision d'inférence sans précédent pour l'apprentissage automatique basé sur un réseau de neurones tout optique. Par exemple, dans une mise en œuvre, les chercheurs de l'UCLA ont démontré numériquement des précisions de test à l'aveugle de 98,59 %, 91,06 % et 51,44 % pour la reconnaissance des images de chiffres manuscrits, produits de mode, et l'ensemble de données d'images en niveaux de gris CIFAR-10 (composé d'avions, voitures, des oiseaux, chats, cerf, chiens, grenouilles, les chevaux, navires, et camions), respectivement [3]. En comparaison, ces résultats d'inférence se rapprochent des performances de certaines des générations précédentes de réseaux de neurones profonds entièrement électroniques, par exemple, LeNet, qui atteint des précisions de classification de 98,77%, 90,27%, et 55,21 % correspondant aux mêmes jeux de données, respectivement. Conceptions de réseaux de neurones électroniques plus récentes, tels que ResNet, obtenir de bien meilleures performances, laissant encore un écart entre les performances des réseaux de neurones tout-optiques et électroniques. Cet écart, cependant, est équilibré par des avantages importants fournis par les réseaux de neurones tout optiques, comme la vitesse d'inférence, évolutivité, le parallélisme et la faible consommation d'énergie des réseaux optiques passifs qui utilisent de la matière artificielle pour calculer par diffraction de la lumière.
Cette recherche a été dirigée par le Dr Aydogan Ozcan, professeur chancelier de génie électrique et informatique à l'UCLA, et directeur associé du California NanoSystems Institute (CNSI). Les autres auteurs de ce travail sont les étudiants diplômés Jingxi Li, Deniz Mengu et Yi Luo, ainsi que le Dr Yair Rivenson, professeur adjoint de génie électrique et informatique à l'UCLA.
"Nos résultats constituent une avancée majeure pour apporter des solutions à faible consommation et à faible latence basées sur un réseau de neurones optiques pour diverses applications d'apprentissage automatique, " a déclaré le professeur Ozcan. De plus, ces avancées systématiques dans la conception de réseaux optiques diffractifs pourraient nous rapprocher du développement de la prochaine génération, des systèmes de caméras informatiques intelligents et spécifiques aux tâches.
Cette recherche a été soutenue par le Groupe Koç, NSF et HHMI.