L'invention optique reflète la puissance de traitement d'image d'un œil humain

Un schéma de transformation d'image géométrique à l'aide de métasurfaces. L'image d'un objet est projetée sur une métasurface d'une longueur inférieure à la longueur d'onde avec une résolution spatiale à l'échelle nanométrique, puis convertie en une image intentionnellement déformée en repositionnant les pixels de manière contrainte. La lumière (la ligne pointillée verte) transmise par chaque pixel de l'image avec une transmission d'amplitude uniquement f (*x, y* ) dans le (*x, y* ) le plan est dirigé par la métasurface avec un profil de phase φ (*x, y* ) à (*X, Y* ) plan, formant une image avec un profil d'intensité redistribué g (*X, Y* ). Crédit :*Communications Nature* (2023). DOI :10.1038/s41467-023-43981-x

Par une journée froide et ensoleillée, vous conduisez sur une route rurale entourée de champs enneigés. En un instant, vos yeux traitent la scène, sélectionnant des objets individuels sur lesquels se concentrer (un panneau d'arrêt, une grange) tandis que le reste de la scène est flou en périphérie. Votre cerveau stocke les images focalisées et floues sous forme de souvenirs qui peuvent être visualisés dans votre esprit plus tard, lorsque vous êtes assis à votre bureau.

Imitant cette puissance de traitement d'image simple et instantanée de l'œil humain, les chercheurs en génie électrique de Penn State ont créé une métasurface :un élément optique semblable à une lame de verre qui utilise de minuscules nanostructures placées à différents angles pour contrôler la lumière. Dirigée par l'auteur correspondant Xingjie Ni, professeur agrégé de génie électrique et d'informatique (EECS) à Penn State, l'équipe a publié son invention dans Nature Communications. .

Les systèmes d’intelligence artificielle (IA) nécessitent une puissance de calcul et une énergie importantes et peuvent être lents à traiter les images et à identifier les objets, selon les chercheurs. En revanche, la métasurface peut être utilisée pour prétraiter et transformer les images avant qu'elles ne soient capturées par une caméra, permettant à un ordinateur (et à l'IA) de les traiter avec une puissance et une bande passante de données minimales.

La métasurface fonctionne en convertissant une image du système de coordonnées cartésiennes, où les pixels de l'image sont disposés en lignes et colonnes droites le long des axes x et y, vers le système log-polaire, qui utilise une distribution de pixels de type bulle.

"Comme la disposition des récepteurs de lumière à l'intérieur de l'œil humain, la métasurface prend des images et les organise dans un système de coordonnées log-polaires, avec des pixels plus denses pour les caractéristiques centrales et focalisées et des pixels plus clairsemés pour les régions périphériques", a déclaré Ni. "Cela permet aux aspects les plus importants d'une photo d'apparaître clairement tandis que d'autres restent moins nets, économisant ainsi la bande passante des données."

La métasurface est placée devant une caméra afin que la lumière la traverse d'abord et transforme l'image du système cartésien en coordonnées log-polaires avant d'être numérisée par une caméra et transférée vers un ordinateur. Puisqu'elle fonctionne à l'aide de nanostructures qui courbent la lumière, la métasurface n'a besoin d'aucune énergie et fonctionne à la vitesse de la lumière.

"Comme l'image d'un objet peut varier en taille ou en orientation, il est souhaitable de prétraiter les images pour les rendre résistantes aux changements d'échelle et de rotation", a déclaré Ni. "Ce prétraitement aide les applications d'IA à les reconnaître plus facilement comme le même objet."

En plaçant une métasurface différente devant une caméra, les chercheurs peuvent également transformer l'image log-polaire en l'image originale avec des coordonnées cartésiennes.

Selon les chercheurs, l'invention a de nombreuses applications potentielles, notamment pour le suivi et la surveillance de cibles afin de cartographier la façon dont une voiture, par exemple, se déplace dans une ville.

"Une métasurface peut être utilisée en tandem avec des systèmes d'IA comme préprocesseur, ce qui facilite la reconnaissance de la même voiture à partir de plusieurs caméras de visualisation de la rue", a déclaré Ni. "Ou s'il est appliqué à un satellite, il pourrait potentiellement suivre les avions du décollage à l'atterrissage."

Plus d'informations : Xingwang Zhang et al, Transformations d'images géométriques entièrement optiques activées par des métasurfaces ultraminces, Nature Communications (2023). DOI :10.1038/s41467-023-43981-x

Fourni par l'Université d'État de Pennsylvanie