Des chercheurs utilisent la vision par ordinateur pour mieux comprendre les illusions d'optique

Crédit :CC0 Domaine public

Illusions d'optique, des images qui trompent l'œil humain, sont un sujet de recherche passionnant, car leur étude peut fournir des informations précieuses sur la cognition et la perception humaines. Chercheurs de l'Université Flinders, en Australie, ont récemment mené une étude très intéressante utilisant un modèle de vision par ordinateur pour prédire l'existence d'illusions d'optique et le degré de leur effet.

Durant la dernière décennie, les chercheurs ont atteint une compréhension biologique de plus en plus détaillée de la façon dont le cerveau humain traite les stimuli visuels. De nombreux modèles de vision par ordinateur existants s'inspirent de notre compréhension actuelle du traitement visuel. Néanmoins, certains aspects du traitement visuel sont encore mal compris et très débattus.

"Le traitement visuel commence par les sensations des champs récepteurs rétiniens (FR) par la lumière entrante dans les yeux, " les chercheurs ont expliqué dans leur article, qui a été prépublié sur arXiv. "Les cellules ganglionnaires rétiniennes (CGR) sont les neurones de sortie rétiniens qui convertissent l'entrée synaptique de la couche plexiforme interne (IPL) et transportent le signal visuel vers le cerveau. La diversité des types de CGR et la dépendance de la taille de chaque type spécifique à l'excentricité ( la distance de la fovéa) sont des preuves physiologiques d'un codage multi-échelle de la scène visuelle dans la rétine. Des modèles informatiques de bas niveau de la vision rétinienne ont été proposés sur la base de l'échantillonnage simultané de la scène visuelle à plusieurs échelles."

Des recherches antérieures ont introduit un modèle pour détecter les inclinaisons illusoires dans l'illusion du mur du café, qui découlent du contraste de l'arrière-plan et des repères d'inclinaison. Dans leur étude, les chercheurs de Flinders University ont généralisé cette approche, afin de couvrir un plus large éventail d'illusions géométriques, ainsi que des illusions de tuiles plus complexes.

"Nous explorons la réponse d'un modèle bio-plausible simple de vision de bas niveau sur des illusions géométriques/carreaux, reproduire la perception erronée de leur géométrie, que nous avons rapporté pour le Café Wall et quelques illusions de carrelage, " les chercheurs ont écrit dans leur article. " Le modèle n'a jusqu'à présent pas été vérifié pour généraliser à ces autres illusions, et c'est ce que nous montrons dans cet article."

Dans leur étude, les chercheurs ont évalué un modèle de filtrage informatique conçu pour modéliser l'inhibition latérale des cellules ganglionnaires rétiniennes et leurs réponses à différentes illusions géométriques. Adoptant cette approche, les chercheurs espéraient mieux comprendre ces illusions, prédire le degré de leur effet.

"Bien que la perception erronée de l'orientation dans les illusions d'inclinaison en général puisse suggérer des explications physiologiques impliquant des cellules sélectives d'orientation dans le cortex, notre travail fournit des preuves d'une théorie selon laquelle l'émergence de l'inclinaison dans ces modèles est initiée avant d'atteindre les cellules à orientation sélective, en raison du mécanisme connu de codage des cellules simples rétiniennes/corticales, ", ont expliqué les chercheurs.

Globalement, les résultats recueillis dans cette étude suggèrent que les différences de Gaussian (DoG), un filtre qui détecte les contours des images, à plusieurs échelles pourrait aider à expliquer l'inclinaison induite dans les illusions de carreaux et pourrait également aider à découvrir certains des indices illusoires perçus lors de l'examen des illusions géométriques. En outre, les chercheurs ont pu lier des processus ascendants à des niveaux supérieurs de perception et de cognition, d'une manière qui est cohérente avec la théorie de la vision et de la détection des contours de David Marr.

Les modèles actuels de vision par ordinateur pour analyser les illusions géométriques sont assez complexes, par conséquent, ils pourraient être plus difficiles à appliquer dans les études de recherche. Selon les chercheurs, les études futures devraient essayer de concevoir des méthodes moins sophistiquées et plus plausibles sur le plan biologique pour détecter les indices visuels.

"Nous pensons qu'une exploration plus poussée du rôle des modèles simples de type gaussien dans le traitement rétinien de bas niveau, et les noyaux gaussiens dans les DNN de stade précoce, et sa prédiction de la perte de l'illusion perceptive conduira à des techniques et des modèles de vision par ordinateur plus précis et peut potentiellement orienter la vision par ordinateur vers ou loin des caractéristiques que les humains détectent, " les chercheurs ont écrit. " Ces effets peuvent, à son tour, devrait contribuer à des modèles de traitement de profondeur et de mouvement de plus haut niveau et généralisé à la compréhension informatique des images naturelles. »

L'observation d'un drone interrompt les vols à l'aéroport d'Irlande à Dublin

Intelligence artificielle inspirée du cerveau dans les robots

Électronique