une, Illustration de la matrice de photodiodes ANN. Tous les sous-pixels de même couleur sont connectés en parallèle pour générer M courants de sortie. b, Schéma de circuit d'un seul pixel dans le réseau de photodiodes. c, ré, Schémas du classificateur (c) et de l'autoencodeur (d). Sous l'illustration de l'autoencodeur, illustré est un exemple d'encodage/décodage d'une lettre de 28 × 28 pixels de la base de données de chiffres manuscrits du MNIST. L'image d'origine est codée en 9 neurones à couche de code, puis décodée en une image. Crédit: La nature (2020). DOI :10.1038/s41586-020-2038-x
En appliquant le calcul dans le capteur des données analogiques, une équipe de chercheurs de l'Institut de photonique de l'Université de technologie de Vienne a mis au point un moyen d'accélérer la vision industrielle. Dans leur article publié dans la revue La nature , le groupe décrit leur conception et leurs performances lors des tests. Yang Chai de l'Université polytechnique de Hong Kong a publié un article sur News &Views dans le même numéro de revue décrivant le travail de l'équipe.
Avec la technologie actuelle, la vision industrielle est réalisée à l'aide d'un système de base impliquant un appareil avec un capteur d'image qui réagit à la lumière. Les données du capteur d'image sont converties d'un signal analogique en un signal numérique avec un autre appareil. Les données numériques sont ensuite traitées par un autre appareil, soit localement, soit dans le cloud. Ce système fonctionne assez bien pour les applications actuelles, mais ne conviendra pas à ceux à l'avenir en raison du décalage impliqué dans la lecture et le traitement d'énormes quantités de données d'image. Dans ce nouvel effort, les chercheurs ont proposé un nouveau type de capteur d'image qui peut traiter des données analogiques dans une mesure limitée.
Le capteur d'image envisagé par l'équipe autrichienne consiste à embarquer des trios de photodiodes sur une puce de manière à permettre d'augmenter ou de diminuer leur sensibilité à la lumière à l'aide d'une tension appliquée, une configuration qui permet à chaque diode d'être réglée ou pondérée individuellement. Dans une telle configuration, les diodes agissent de la même manière que les nerfs de l'œil humain. Au fur et à mesure que les images sont présentées à l'appareil, toutes les diodes réagissent en fonction de leur accord - ensemble, ils servent de processeur de vision réseau. Lorsque la lumière arrive au capteur, il est traité en ajoutant l'intensité lumineuse de chacune des colonnes et des lignes qui composent le réseau de capteurs. Le réseau de diodes est ensuite entraîné pour une tâche en ajustant chaque membre individuellement en fonction du résultat souhaité. La phase d'apprentissage initiale prend un peu de temps, mais une fois le réseau formé, le traitement s'effectue à une vitesse égale au temps de réaction des photodiodes.
L'appareil imaginé par les chercheurs n'était pas destiné à produire des images. Au lieu, il filtre les données inutiles et effectue un premier tri. Pour le tester, les chercheurs ont appris à leur appareil à trier trois lettres simplifiées. Ils l'ont également utilisé pour effectuer un encodage automatique très basique basé sur les principales caractéristiques d'une image donnée. Ils notent que leur conception et leur appareil sont encore au stade de la preuve de concept, mais disent que leurs conclusions jusqu'à présent sont encourageantes.
© 2020 Réseau Science X