• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Des chercheurs apprennent aux ordinateurs à voir des illusions d'optique

    Les experts en vision par ordinateur de l'Université Brown enseignent aux ordinateurs à voir les illusions d'optique contextuelles, dans l'espoir d'aider les algorithmes de vision artificielle à prendre en compte le contexte et à être plus robustes. Crédit :Serre Lab/Brown University

    Ce cercle est-il vert ou gris ? Les lignes médianes sont-elles droites ou inclinées ?

    Les illusions d'optique peuvent être amusantes à expérimenter et à débattre, mais comprendre comment le cerveau humain perçoit ces différents phénomènes reste un domaine de recherche scientifique actif. Pour une classe d'illusions d'optique, appelés phénomènes contextuels, ces perceptions sont connues pour dépendre du contexte. Par exemple, la couleur que vous pensez être un cercle central dépend de la couleur de l'anneau environnant. Parfois, la couleur extérieure rend la couleur intérieure plus similaire, comme un anneau vert voisin faisant apparaître un anneau bleu turquoise, mais parfois la couleur extérieure rend la couleur intérieure moins similaire, comme un anneau rose faisant apparaître un cercle gris verdâtre.

    Une équipe d'experts en vision par ordinateur de l'Université Brown est revenue à la case départ pour comprendre les mécanismes neuronaux de ces phénomènes contextuels. Leur étude a été publiée le 20 septembre dans Examen psychologique .

    "Il y a un consensus croissant sur le fait que les illusions d'optique ne sont pas un bug mais une fonctionnalité, " dit Thomas Serre, professeur agrégé de cognition, sciences linguistiques et psychologiques à Brown et auteur principal de l'article. "Je pense qu'ils sont une caractéristique. Ils peuvent représenter des cas limites pour notre système visuel, mais notre vision est si puissante dans la vie de tous les jours et dans la reconnaissance des objets."

    Pour l'étude, l'équipe dirigée par Serre, qui est affilié au Brown's Carney Institute for Brain Science, a commencé avec un modèle informatique contraint par des données anatomiques et neurophysiologiques du cortex visuel. Le modèle visait à capturer comment les neurones corticaux voisins s'envoient des messages et ajustent leurs réponses mutuelles lorsqu'ils sont soumis à des stimuli complexes tels que des illusions d'optique contextuelles.

    Une innovation que l'équipe a incluse dans son modèle était un modèle spécifique de connexions de rétroaction hypothétiques entre les neurones, dit Serre. Ces connexions de rétroaction sont capables d'augmenter ou de diminuer - d'exciter ou d'inhiber - la réponse d'un neurone central, selon le contexte visuel.

    Ces connexions de rétroaction ne sont pas présentes dans la plupart des algorithmes d'apprentissage en profondeur. L'apprentissage en profondeur est une sorte d'intelligence artificielle puissante qui est capable d'apprendre des modèles complexes dans les données, comme la reconnaissance d'images et l'analyse de la parole normale, et dépend de plusieurs couches de réseaux de neurones artificiels travaillant ensemble. Cependant, la plupart des algorithmes d'apprentissage en profondeur n'incluent que des connexions anticipées entre les couches, pas les connexions de rétroaction innovantes de Serre entre les neurones au sein d'une couche.

    Une fois le modèle construit, l'équipe lui a présenté une variété d'illusions contextuelles. Les chercheurs ont "réglé" la force des connexions excitatrices ou inhibitrices de rétroaction afin que les neurones modèles répondent d'une manière cohérente avec les données neurophysiologiques du cortex visuel des primates.

    Ensuite, ils ont testé le modèle sur une variété d'illusions contextuelles et ont de nouveau découvert que le modèle percevait les illusions comme les humains.

    Afin de tester s'ils ont rendu le modèle inutilement complexe, ils ont lésé le modèle, supprimant sélectivement certaines des connexions. Lorsque le modèle manquait certaines des connexions, les données ne correspondaient pas aussi précisément aux données de perception humaine.

    "Notre modèle est le modèle le plus simple qui soit à la fois nécessaire et suffisant pour expliquer le comportement du cortex visuel vis-à-vis des illusions contextuelles, " a déclaré Serre. " C'était vraiment un travail de neuroscience computationnelle de manuel - nous avons commencé avec un modèle pour expliquer les données de neurophysiologie et avons terminé avec des prédictions pour les données de psychophysique humaine. "

    En plus de fournir une explication unificatrice de la façon dont les humains voient une classe d'illusions d'optique, Serre s'appuie sur ce modèle dans le but d'améliorer la vision artificielle.

    Algorithmes de vision artificielle de pointe, tels que ceux utilisés pour marquer les visages ou reconnaître les panneaux d'arrêt, avoir du mal à voir le contexte, il a noté. En incluant des connexions horizontales réglées par des illusions d'optique contextuelles, il espère remédier à cette faiblesse.

    Peut-être que les programmes d'apprentissage profond visuel qui tiennent compte du contexte seront plus difficiles à tromper. Un certain autocollant, lorsqu'il est coincé sur un panneau d'arrêt peut tromper un système de vision artificielle en lui faisant croire qu'il s'agit d'un panneau de limitation de vitesse à 65 milles à l'heure, ce qui est dangereux, dit Serre.


    © Science https://fr.scienceaq.com