Configuration expérimentale de l'apprentissage par renforcement basé sur le chaos laser. Crédit :Naruse et al.
(Phys.org) - La prise de décision est généralement considérée comme quelque chose faite par des êtres vivants intelligents et, dans les temps modernes, des ordinateurs. Mais depuis quelques années, les chercheurs ont démontré que des objets physiques tels qu'une barre de métal [vidéo], liquides [papier], et les lasers peuvent également « prendre des décisions » en répondant aux commentaires de leur environnement. Et ils ont montré que, dans certains cas, les objets physiques peuvent potentiellement prendre des décisions plus rapidement et avec plus de précision que ce dont les humains et les ordinateurs sont capables.
Dans une nouvelle étude, une équipe de chercheurs du Japon a démontré que l'ultrarapide, la dynamique oscillatoire chaotique des lasers rend ces dispositifs capables de prise de décision et d'apprentissage par renforcement, qui est l'une des composantes majeures de l'apprentissage automatique. Au meilleur de la connaissance des chercheurs, c'est la première démonstration de prise de décision photonique ultrarapide ou d'apprentissage par renforcement, et il ouvre les portes à de futures recherches sur « l'intelligence photonique ».
« Dans notre démonstration, nous utilisons la puissance de calcul inhérente aux phénomènes physiques, " Le co-auteur Makoto Naruse de l'Institut national des technologies de l'information et de la communication à Tokyo a déclaré Phys.org . « La puissance de calcul des phénomènes physiques est basée sur des « degrés de liberté infinis », ' et la 'non-localité des interactions' et les 'fluctuations' qui en résultent. Il contient des principes de calcul complètement nouveaux. De tels systèmes offrent un potentiel énorme pour notre future société axée sur le renseignement. Nous appelons de tels systèmes « Intelligence naturelle » par opposition à l'intelligence artificielle. »
Dans les expériences, les chercheurs ont démontré que la vitesse optimale à laquelle le chaos laser peut prendre des décisions est de 1 décision toutes les 50 picosecondes (ou environ 20 décisions par nanoseconde), une vitesse impossible à atteindre par d'autres mécanismes. Avec cette vitesse rapide, la prise de décision basée sur le chaos laser a des applications potentielles dans des domaines tels que le trading haute fréquence, gestion de l'infrastructure du centre de données, et d'autres utilisations haut de gamme.
Les chercheurs ont démontré la capacité du laser en le faisant résoudre le problème des bandits à plusieurs bras, qui est une tâche fondamentale dans l'apprentissage par renforcement. Dans ce problème, le décideur joue à différentes machines à sous avec des probabilités de gain différentes, et doit trouver la machine à sous avec la probabilité de gain la plus élevée afin de maximiser sa récompense totale. Dans ce jeu, il y a un compromis entre passer du temps à explorer différentes machines à sous et prendre une décision rapide :explorer peut faire perdre du temps, mais si une décision est prise trop rapidement, la meilleure machine peut être négligée.
Une clé de la capacité du laser est de combiner le chaos laser avec une stratégie de prise de décision connue sous le nom de "tir à la corde, " soi-disant parce que le décideur est constamment " attiré " vers une machine à sous ou une autre, en fonction des retours qu'il reçoit de son jeu précédent. Afin de réaliser cette stratégie dans un laser, les chercheurs ont combiné le laser avec un ajusteur de seuil dont la valeur se décale de manière à jouer à la machine à sous avec la probabilité de récompense la plus élevée. Comme l'expliquent les chercheurs, le laser produit une valeur de sortie différente en fonction de la valeur seuil.
"Appelons l'une des machines à sous 'machine 0' et l'autre 'machine 1', " a déclaré le coauteur Songju Kim, à l'Institut national des sciences des matériaux de Tsukuba, Japon. "La sortie du décideur laser est '0' ou '1'. Si le niveau de signal de la dynamique oscillatoire chaotique est supérieur à la valeur seuil (qui est configurée dynamiquement), alors la sortie est '0, ' et cela signifie directement que la décision est de choisir 'machine 0'. Si le niveau de signal de la dynamique oscillatoire chaotique est inférieur à la valeur seuil (qui est configurée dynamiquement), alors la sortie est '1, ' et cela signifie directement que la décision est de choisir 'machine 1'"
Les chercheurs s'attendent à ce que ce système puisse être étendu, étendu aux problèmes d'apprentissage automatique de niveau supérieur, et conduire à de nouvelles applications du chaos laser dans le domaine de l'intelligence artificielle.
© 2017 Phys.org