• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Un réseau d'attention guidée par masque de parties du corps à plusieurs échelles pour la réidentification des personnes

    Image 1 :Nous pouvons accorder plus d'attention au corps humain, haut du corps et bas du corps. Crédit :Cai, Wang &Cheng.

    La ré-identification d'une personne implique l'identification automatisée de la même personne dans plusieurs images provenant de différentes caméras et avec des arrière-plans différents, angles ou positions. Malgré les avancées récentes dans le domaine de l'intelligence artificielle (IA), la réidentification de la personne reste une tâche très difficile, notamment en raison des nombreuses variations dans la pose d'une personne, ainsi que d'autres différences liées à l'éclairage, occlusion, désalignement et encombrement de l'arrière-plan.

    Des chercheurs du Suning R&D Center aux États-Unis ont récemment développé une nouvelle technique de réidentification des personnes basée sur un réseau d'attention guidée par masque (MMGA) à plusieurs échelles. Leur papier, prépublié sur arXiv, sera présenté lors de la présentation sous les projecteurs de l'atelier CVPR 2019 en juin.

    "La ré-identification des personnes devient une tâche de plus en plus importante en raison de son large éventail d'applications potentielles, comme une enquête criminelle, sécurité publique et récupération d'images, " Honglong Cai, l'un des chercheurs qui a mené l'étude, Raconté TechXplore . "Toutefois, cela reste une tâche difficile, en raison de l'occlusion, désalignement, variation des poses et encombrement de fond. Dans notre étude récente, notre équipe a essayé de développer une méthode pour surmonter ces défis."

    Au lieu de vous concentrer sur des images entières, Cai et ses collègues ont développé un modèle de réidentification des personnes qui ne prête attention qu'à la personne d'intérêt, en ignorant le fond. Poussant cette idée un peu plus loin, leur modèle analyse différentes parties du corps de la personne dans une image donnée.

    "Pour mettre en œuvre notre idée, nous avons proposé de manière créative un réseau d'attention guidée par masque de parties du corps à plusieurs échelles, " a déclaré Cai. "Nous appliquons des masques corporels pour guider la formation de notre modèle afin qu'il puisse accorder plus d'attention au corps humain dans l'image. Notre modèle contient deux parties :un extracteur de caractéristiques et un module d'attention."

    Les 5 premiers résultats de récupération pour les images de requête sont tous corrects. Crédit :Cai, Wang &Cheng.

    Le composant d'extraction de caractéristiques du modèle conçu par Cai et ses collègues peut extraire des caractéristiques discriminantes du corps des personnes à partir d'images. Le module attention du modèle, d'autre part, guide le réseau MMGA, en mettant en évidence les zones de l'image (c'est-à-dire les pixels) auxquelles il doit prêter plus d'attention.

    Les chercheurs ont utilisé des masques corporels pour guider la formation du module d'attention de leur modèle, car cela lui permet de discerner les corps humains des informations de base. En outre, ils divisent les masques corporels en masques pour le haut et le bas du corps, afin que le module d'attention puisse apprendre à distinguer les parties supérieure et inférieure du corps d'une personne.

    « À la différence de la plupart des méthodes actuelles de réidentification des personnes, qui divisent les images en diapositives fixes, notre modèle peut dire exactement où se trouvent le haut et le bas du corps, " expliqua Cai. " De plus, les masques corporels ne sont utilisés que dans la phase d'entraînement, et nous n'exigeons pas de masques corporels dans la phase d'inférence, ce qui rend notre modèle très efficace dans les applications pratiques."

    Pour évaluer leur modèle, Cai et ses collègues ont mené une série d'expériences pour tester ses performances sur deux ensembles de données, à savoir les ensembles de données Market-1501 et DukeMTMC-reID. Ils ont découvert que leur modèle peut réduire les effets négatifs des variations dans la pose d'une personne, désalignement et encombrement d'arrière-plan, surpassant les méthodes de ré-identification de pointe.

    Les résultats recueillis par les chercheurs suggèrent que les mécanismes d'attention peuvent améliorer considérablement la précision des réseaux de réidentification des personnes. De plus, leur étude a introduit une méthode d'entraînement à l'attention du guide de masque qui peut encore améliorer cette précision.

    « Dans nos récents travaux, des masques pour le haut du corps et des masques pour le bas du corps sont utilisés pour guider l'entraînement du module d'attention, " dit Cai. " A l'avenir, nous aimerions essayer de diviser les masques corporels en détails plus fins tels que la tête, main, bras, jambe, etc., car cela pourrait encore améliorer l'exactitude de la réidentification de la personne."

    © 2019 Réseau Science X




    © Science https://fr.scienceaq.com