Imagerie spécifique à une classe d'objets à l'aide d'une caméra diffractive. a Illustration d'une caméra diffractive à trois couches entraînée pour effectuer une imagerie spécifique à une classe d'objets avec un effacement tout optique instantané des autres classes d'objets à sa sortie FOV. b La configuration expérimentale pour les tests de caméra diffractive utilisant un éclairage THz cohérent. Crédit :eLight (2022). DOI :10.1186/s43593-022-00021-3
Au cours de la dernière décennie, les appareils photo numériques ont été largement adoptés dans divers aspects de notre société et sont massivement utilisés dans les téléphones mobiles, la surveillance de sécurité, les véhicules autonomes et la reconnaissance faciale. Grâce à ces caméras, d'énormes quantités de données d'image sont générées, ce qui soulève des inquiétudes croissantes quant à la protection de la vie privée.
Certaines méthodes existantes répondent à ces préoccupations en appliquant des algorithmes pour masquer les informations sensibles des images acquises, telles que le flou d'image ou le cryptage. Cependant, de telles méthodes risquent toujours d'exposer des données sensibles car les images brutes sont déjà capturées avant de subir un traitement numérique pour masquer ou crypter les informations sensibles. De plus, le calcul de ces algorithmes nécessite une consommation électrique supplémentaire. D'autres efforts ont également été déployés pour trouver des solutions à ce problème en utilisant des caméras personnalisées pour dégrader la qualité de l'image afin que les informations identifiables puissent être dissimulées. Cependant, ces approches sacrifient la qualité globale de l'image pour tous les objets d'intérêt, ce qui n'est pas souhaité, et elles sont toujours vulnérables aux attaques adverses pour récupérer les informations sensibles qui sont enregistrées.
Un nouveau document de recherche publié dans eLight a démontré un nouveau paradigme pour obtenir une imagerie préservant la confidentialité en construisant un type d'imageur fondamentalement nouveau conçu par l'IA. Dans leur article, les chercheurs de l'UCLA, dirigés par le professeur Aydogan Ozcan, ont présenté une conception de caméra intelligente qui n'image que certains types d'objets souhaités, tout en effaçant instantanément d'autres types d'objets de ses images sans nécessiter de traitement numérique.
Cette nouvelle conception de caméra consiste en des surfaces transmissives successives, chacune composée de dizaines de milliers de caractéristiques diffractives à l'échelle de la longueur d'onde de la lumière. La structure de ces surfaces transmissives est optimisée à l'aide d'un apprentissage en profondeur pour moduler la phase des champs optiques transmis de sorte que la caméra n'image que certains types/classes d'objets souhaités et efface les autres. Après sa conception basée sur le deep learning (formation), les couches résultantes sont fabriquées et assemblées en 3D, formant la caméra intelligente. Après son assemblage, lorsque les objets d'entrée des classes d'objets cibles apparaissent devant, ils forment des images de haute qualité à la sortie de la caméra, comme vous le souhaitez. En revanche, lorsque les objets d'entrée devant la même caméra appartiennent à d'autres classes indésirables, ils sont optiquement effacés, formant des motifs non informatifs et de faible intensité similaires à du bruit aléatoire.
Étant donné que les informations caractéristiques des classes d'objets indésirables sont entièrement effacées optiquement à la sortie de la caméra par diffraction de la lumière, cette caméra conçue par l'IA n'enregistre jamais leurs images directes. Par conséquent, la protection de la vie privée est maximisée puisqu'une attaque contradictoire qui a accès aux images enregistrées de cette caméra ne peut pas ramener les informations. Cette fonctionnalité peut également réduire la charge de stockage et de transmission des données des caméras puisque les images d'objets indésirables ne sont pas enregistrées.
Pour démontrer expérimentalement cette caméra unique spécifique aux données, l'équipe de recherche de l'UCLA l'a conçue pour imager spécifiquement et sélectivement une seule classe de chiffres manuscrits, et a fabriqué la caméra conçue à l'aide de l'impression 3D. Cette caméra imprimée en 3D a été testée à l'aide d'ondes térahertz éclairant des chiffres manuscrits. Conformément aux principes fondamentaux de sa conception, la caméra intelligente a pu imager de manière sélective les objets d'entrée uniquement s'il s'agissait de chiffres manuscrits "2", tout en effaçant instantanément tous les autres chiffres manuscrits des images de sortie, produisant des caractéristiques de type bruit de faible intensité. .
En plus des chiffres manuscrits, les chercheurs de l'UCLA ont également démontré une autre variante de la même conception d'appareil photo spécifique à la classe en imageant sélectivement un type de produit de mode (par exemple, un pantalon), tout en effaçant instantanément d'autres produits de mode de la sortie de l'appareil photo. L'équipe de recherche a rigoureusement testé la conception de sa caméra dans des conditions d'éclairage variables qui n'ont jamais été incluses dans sa formation, et a montré que cette caméra intelligente est résistante aux variations d'éclairage.
Au-delà de l'imagerie spécifique à la classe de données, cette conception de caméra basée sur l'IA a également été utilisée pour construire des caméras de cryptage, offrant une couche supplémentaire de sécurité et de protection de la vie privée. Une telle caméra de cryptage, conçue à l'aide de couches diffractives optimisées pour l'IA, effectue optiquement une transformation linéaire sélectionnée, exclusivement pour les objets cibles d'intérêt. Only those with access to the decryption key (i.e., the inverse linear transformation in this case) can recover the original image of the target objects. On the other hand, the information of the other undesired objects is irreversibly lost since the AI-designed camera all-optically erases them at the output. Therefore, even if the decryption key is applied to the recorded images, it yields noise-like, unrecognizable features for other classes of undesired objects.
Except for the illumination light, this smart camera does not require any external power for its computation and operates at the speed of light. Therefore, it is fast, data- and energy-efficient, making it especially suitable for task-specific, privacy-aware, and power-limited imaging applications. The core teachings of this diffractive camera design can inspire future imaging systems that consume orders of magnitude less computing and data transmission power.
This research was led by Professor Aydogan Ozcan, the associate director of the California NanoSystems Institute (CNSI) and the Volgenau Chair for Engineering Innovation at the Electrical and Computer Engineering (ECE) department at UCLA, along with Professor Mona Jarrahi, the Northrop Grumman Endowed Chair and the director of the Terahertz Electronics Laboratory at UCLA ECE. The other authors of this work include graduate students Bijie Bai, Yi Luo, Tianyi Gan, Yuhang Li, Yifan Zhao, Deniz Mengu and post-doctoral researcher Dr. Jingtian Hu, all with the ECE department at UCLA. All-optical phase recovery and quantitative phase imaging performed instantly without a computer