L'illustration montre le squelette correspondant aux humains dans une image. Les angles (indiqués en vert pour quelques membres) entre les différents membres de cette structure sont utilisés par le SVM pour reconnaître les humains engagés dans des activités violentes. Crédit :arXiv:1806.00746 [cs.CV]
Trois chercheurs, Amarjot Singh (Université de Cambridge), Devendra Patil (NIT Warangal Inde), et SN Omkar (IISc Bangalore) travaillent sur l'utilisation d'un drone et d'une intelligence artificielle pour repérer les combattants dans une foule.
Leur article "Eye in the Sky:Real-time Drone Surveillance System (DSS) for Violent Individuals Identification using ScatterNet Hybrid Deep Learning Network" est sur arXiv. Une vidéo montre comment fonctionne leur système.
DroneDJ résume leur approche, disant qu'ils utilisent un "drone grand public standard, le charge d'IA et le fait surveiller une zone surpeuplée telle qu'un stade de sport ou une manifestation et recherche des actes de violence tels que des coups de poing, coups de pied, étranglement, tirer ou poignarder."
Pourquoi s'embêter? Les caméras de vidéosurveillance standard ne sont-elles pas adéquates ? Les caméras de vidéosurveillance standard ne font pas le meilleur travail pour surveiller les criminels violents dans les grands espaces publics. Entrez les drones.
L'article apparaîtra dans un atelier à IEEE Computer Vision and Pattern Recognition (CVPR) 2018 ce mois-ci. Le système détecte les individus violents en temps réel en traitant les images du drone dans le cloud.
Ils ont abordé cinq types d'actes violents dans leur article :coups de poing, coups de pied, étranglement, tirer ou poignarder.
Leurs recherches ont introduit ce qu'ils appellent "l'ensemble de données individuelles violentes aériennes utilisées pour entraîner le réseau profond". Espérons que cela pourrait encourager d'autres chercheurs intéressés à utiliser l'apprentissage en profondeur pour la surveillance aérienne, ils ont dit.
Jacques Vincent dans Le bord a expliqué qu'un algorithme formé à l'aide de l'apprentissage en profondeur estime les poses des humains dans la vidéo et les associe à des postures que les chercheurs ont qualifiées de violentes. La vidéo a noté que les personnes violentes sont marquées par des cadres de délimitation.
Quelle est l'efficacité de leur système? Le niveau de précision diminue lorsque plus de personnes entrent en scène. James Vincent :« Cependant, la recherche doit être prise avec des pincettes, notamment en ce qui concerne ses prétentions à l'exactitude. Singh et ses collègues rapportent que leur système était précis à 94 % pour identifier les poses « violentes », mais ils notent que plus il y a de personnes qui apparaissent dans le cadre, plus ce chiffre est bas. (Il est tombé à 79 % de précision lorsque l'on examine 10 individus.) »
Leur travail reflète un intérêt de recherche pour explorer les moyens d'utiliser l'apprentissage automatique pour analyser des séquences vidéo en direct. Ils prévoient de le tester lors de deux prochains festivals en Inde, mentionné DroneDJ .
Le document présente également l'ensemble de données Aerial Violent Individual (AVI) qui peut profiter à d'autres chercheurs visant à utiliser l'apprentissage en profondeur pour les applications de surveillance aérienne.
Dans l'image plus grande, il est maintenant évident que le mot "surveillance" est en soi un terme chargé, et l'on pense à des gouvernements répressifs désireux de faire taire les manifestants en les mettant sous clé pour des raisons fragiles. D'autre part, les sociétés font face aux vandales, groupes haineux et enlèvements.
"Tout peut être utilisé pour le bien. Tout peut être utilisé pour le mal, " dit Singh, chercheur principal, dans Le bord .
© 2018 Tech Xplore