• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Physique
    Classification d'objets via un détecteur à un seul pixel

    Les chercheurs de l'UCLA ont créé un système de vision industrielle à pixel unique qui peut coder les informations spatiales des objets dans le spectre de la lumière pour classer optiquement les objets d'entrée et reconstruire leurs images à l'aide d'un détecteur à pixel unique. Crédit :Ozcan Lab @ UCLA.

    Les systèmes de vision industrielle ont de nombreuses applications, y compris les voitures autonomes, fabrication intelligente, chirurgie robotique et imagerie biomédicale, parmi beaucoup d'autres. La plupart de ces systèmes de vision industrielle utilisent des caméras à objectif, et après la capture d'une image ou d'une vidéo, généralement avec quelques mégapixels par image, un processeur numérique est utilisé pour effectuer des tâches d'apprentissage automatique, telles que la classification d'objets et la segmentation de scènes. Une telle architecture de vision industrielle traditionnelle souffre de plusieurs inconvénients. D'abord, la grande quantité d'informations numériques rend difficile la réalisation d'analyses d'images/vidéos à grande vitesse, en particulier en utilisant des appareils mobiles et alimentés par batterie. En outre, les images capturées contiennent généralement des informations redondantes, qui submerge le processeur numérique d'une charge de calcul élevée, créant des inefficacités en termes de puissance et de mémoire. De plus, au-delà des longueurs d'onde visibles de la lumière, fabriquer des capteurs d'images à grand nombre de pixels, comme ce que nous avons dans nos caméras de téléphones portables, est difficile et coûteux, ce qui limite les applications des méthodes de vision industrielle standard à des longueurs d'onde plus longues, tels que la partie térahertz du spectre.

    Des chercheurs de l'UCLA ont signalé une nouvelle, cadre de vision industrielle à pixel unique qui fournit une solution pour atténuer les lacunes et les inefficacités des systèmes de vision industrielle traditionnels. Ils ont tiré parti de l'apprentissage en profondeur pour concevoir des réseaux optiques créés par des surfaces diffractives successives pour effectuer des calculs et des inférences statistiques lorsque la lumière d'entrée traverse ces couches spécialement conçues et fabriquées en 3D. Contrairement aux caméras à objectif ordinaires, ces réseaux optiques diffractifs sont conçus pour traiter la lumière entrante à des longueurs d'onde sélectionnées dans le but d'extraire et de coder les caractéristiques spatiales d'un objet d'entrée sur le spectre de la lumière diffractée, qui est collecté par un détecteur à un seul pixel. Différents types d'objets ou classes de données sont affectés à différentes longueurs d'onde de lumière. Les objets d'entrée sont automatiquement classés optiquement, en utilisant simplement le spectre de sortie détecté par un seul pixel, en évitant le besoin d'un réseau de capteurs d'images ou d'un processeur numérique. Cette capacité d'inférence tout optique et de vision industrielle via un détecteur à pixel unique couplé à un réseau diffractif offre des avantages transformateurs en termes de fréquence d'images, exigence de mémoire et efficacité énergétique, qui sont particulièrement importants pour les applications informatiques mobiles.

    Dans une étude publiée dans Avancées scientifiques , Des chercheurs de l'UCLA ont démontré expérimentalement le succès de leur cadre aux longueurs d'onde térahertz en classant les images de chiffres manuscrits à l'aide d'un seul détecteur de pixel et de couches diffractives imprimées en 3D. La classification optique des objets d'entrée (chiffres manuscrits) a été effectuée sur la base du signal maximum parmi les dix longueurs d'onde qui étaient, un par un, attribué à différents chiffres manuscrits (0 à 9). Malgré l'utilisation d'un détecteur à un seul pixel, une précision de classification optique de plus de 96% a été atteinte. Une étude expérimentale de preuve de concept avec des couches diffractives imprimées en 3D a montré un accord étroit avec les simulations numériques, démontrant l'efficacité du cadre de vision industrielle à pixel unique pour la création de systèmes d'apprentissage automatique à faible latence et économes en ressources. En plus de la classification des objets, les chercheurs ont également connecté le même réseau optique diffractif à un seul pixel avec un simple, réseau de neurones électroniques peu profonds, reconstruire rapidement les images des objets d'entrée à partir de la seule puissance détectée à dix longueurs d'onde distinctes, démontrant une décompression d'image spécifique à une tâche.

    Ce cadre de classification d'objets et de reconstruction d'images à un seul pixel pourrait ouvrir la voie au développement de nouveaux systèmes de vision industrielle qui utilisent le codage spectral des informations d'objets pour réaliser une tâche d'inférence spécifique d'une manière économe en ressources, à faible latence, faible puissance et faible nombre de pixels. Ce nouveau cadre peut également être étendu à divers systèmes de mesure du domaine spectral, comme la tomographie par cohérence optique, Spectroscopie infrarouge et autres, pour créer des modalités d'imagerie et de détection 3D fondamentalement nouvelles intégrées à un codage basé sur un réseau diffractif d'informations spectrales et spatiales.


    © Science https://fr.scienceaq.com