Crédit :Massachusetts Institute of Technology
Systèmes informatiques "Deep Learning", basé sur des réseaux de neurones artificiels qui imitent la façon dont le cerveau apprend à partir d'une accumulation d'exemples, sont devenus un sujet brûlant en informatique. En plus des technologies habilitantes telles que les logiciels de reconnaissance faciale et vocale, ces systèmes pourraient parcourir de vastes quantités de données médicales pour trouver des modèles qui pourraient être utiles au diagnostic, ou numérisez des formules chimiques pour d'éventuels nouveaux produits pharmaceutiques.
Mais les calculs que ces systèmes doivent effectuer sont très complexes et exigeants, même pour les ordinateurs les plus puissants.
Maintenant, une équipe de chercheurs du MIT et d'ailleurs a développé une nouvelle approche de ces calculs, utiliser la lumière au lieu de l'électricité, ce qui, selon eux, pourrait considérablement améliorer la vitesse et l'efficacité de certains calculs d'apprentissage en profondeur. Leurs résultats paraissent aujourd'hui dans la revue Photonique de la nature dans un article du postdoctorant du MIT Yichen Shen, étudiant diplômé Nicholas Harris, les professeurs Marin Soljacic et Dirk Englund, et huit autres.
Soljacic dit que de nombreux chercheurs au fil des ans ont fait des déclarations sur les ordinateurs basés sur l'optique, mais que « les gens ont considérablement trop promis, et cela s'est retourné contre nous." Alors que de nombreuses utilisations proposées de tels ordinateurs photoniques se sont avérées non un système de réseau de neurones basé sur la lumière développé par cette équipe "peut être applicable pour l'apprentissage en profondeur pour certaines applications, " il dit.
Les architectures informatiques traditionnelles ne sont pas très efficaces en ce qui concerne les types de calculs nécessaires pour certaines tâches importantes du réseau de neurones. De telles tâches impliquent généralement des multiplications répétées de matrices, ce qui peut être très gourmand en calcul dans les puces CPU ou GPU conventionnelles.
Après des années de recherche, l'équipe du MIT a trouvé un moyen d'effectuer ces opérations de manière optique à la place. "Cette puce, une fois que vous l'avez réglé, peut effectuer une multiplication matricielle avec, en principe, zéro énergie, Presque instantanément, ", dit Soljacic. "Nous avons démontré les éléments essentiels, mais pas encore le système complet."
Par analogie, Soljacic souligne que même un verre de lunettes ordinaire effectue un calcul complexe (la transformée de Fourier) sur les ondes lumineuses qui le traversent. La façon dont les faisceaux lumineux effectuent les calculs dans les nouvelles puces photoniques est beaucoup plus générale mais repose sur un principe sous-jacent similaire. La nouvelle approche utilise plusieurs faisceaux lumineux dirigés de manière à ce que leurs ondes interagissent les unes avec les autres, produisant des motifs d'interférence qui traduisent le résultat de l'opération prévue. Le dispositif résultant est quelque chose que les chercheurs appellent un processeur nanophotonique programmable.
Le résultat, Shen dit, est que les puces optiques utilisant cette architecture pourraient, en principe, effectuer des calculs effectués dans des algorithmes d'intelligence artificielle typiques beaucoup plus rapidement et en utilisant moins d'un millième d'énergie par opération que les puces électroniques conventionnelles. "L'avantage naturel d'utiliser la lumière pour faire la multiplication matricielle joue un grand rôle dans l'accélération et les économies d'énergie, parce que les multiplications matricielles denses sont la partie la plus gourmande en énergie et la plus longue des algorithmes d'IA", dit-il.
Le nouveau processeur nanophotonique programmable, qui a été développé dans le laboratoire d'Englund par Harris et ses collaborateurs, utilise un réseau de guides d'ondes interconnectés de manière à pouvoir être modifiés selon les besoins, programmer cet ensemble de poutres pour un calcul spécifique. "Vous pouvez programmer dans n'importe quelle opération matricielle, ", dit Harris. Le processeur guide la lumière à travers une série de guides d'ondes photoniques couplés. La proposition complète de l'équipe fait appel à des couches de dispositifs entrelacés qui appliquent une opération appelée fonction d'activation non linéaire, en analogie avec le fonctionnement des neurones dans le cerveau.
Pour démontrer le concept, l'équipe a configuré le processeur nanophotonique programmable pour mettre en œuvre un réseau neuronal qui reconnaît quatre voyelles de base. Même avec ce système rudimentaire, ils ont pu atteindre un niveau de précision de 77 %, contre environ 90 pour cent pour les systèmes conventionnels. Il n'y a "pas d'obstacles substantiels" à la mise à l'échelle du système pour une plus grande précision, dit Soljacic.
Englund ajoute que le processeur nanophotonique programmable pourrait également avoir d'autres applications, y compris le traitement du signal pour la transmission de données. "Le traitement du signal analogique à grande vitesse est quelque chose que cela pourrait gérer" plus rapidement que d'autres approches qui convertissent d'abord le signal sous forme numérique, puisque la lumière est un médium intrinsèquement analogique. "Cette approche pourrait faire le traitement directement dans le domaine analogique, " il dit.
L'équipe dit qu'il faudra encore beaucoup plus d'efforts et de temps pour rendre ce système utile; cependant, une fois le système mis à l'échelle et pleinement opérationnel, il peut trouver de nombreux cas d'utilisateurs, tels que les centres de données ou les systèmes de sécurité. Le système pourrait également être une aubaine pour les voitures ou les drones autonomes, dit Harris, ou "chaque fois que vous avez besoin de faire beaucoup de calculs mais que vous n'avez pas beaucoup de puissance ou de temps."
Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.