Flux de processus d'algorithme. Trois phases principales caractérisent le flux de travail :(a) le calcul du signal temporel à partir des patchs de visage et du débruitage ; (b) normalisation du signal; et (c) l'extraction de caractéristiques et la classification SVM. Crédit :Bonomi et Boato
Les progrès récents de l'infographie permettent de créer des représentations générées par ordinateur (CG) d'êtres humains qui sont difficiles à distinguer de leurs homologues du monde réel. "Détection numérique de visage humain dans des séquences vidéo via une analyse de signal physiologique, " un article publié aujourd'hui dans le Journal d'imagerie électronique (JEI) , présente une manière innovante de discerner entre les humains naturels (NAT) et les visages CG dans le contexte de la criminalistique multimédia, en utilisant la fréquence cardiaque des individus comme élément discriminant. JEI est coédité par SPIE, la société internationale d'optique et de photonique, et par la Society for Imaging Science and Technology (IS&T).
Les humains présentent un signal d'impulsion qui peut être extrait automatiquement d'une séquence vidéo; les humains virtuels ne le font pas. Dans leur papier, Mattia Bonomi et Giulia Boato démontrent qu'en se concentrant sur un algorithme d'estimation de la fréquence du pouls à partir de visages humains et en calculant des statistiques à partir de cette fréquence cardiaque, ils peuvent classer la face d'entrée comme CG ou NAT.
« Les progrès récents de l'apprentissage automatique et de l'infographie ont conduit au développement rapide de« deepfakes, ' où le visage d'une personne réelle dans une vidéo est remplacé par un visage généré par ordinateur, » note Karén Egiazarian, rédactrice en chef de JEI. « Cette technologie est ouvertement disponible de nos jours, et, avec sa large utilisation dans l'industrie du cinéma et des publicités, il a également été utilisé par des fraudeurs. Mais comment distinguer un visage humain d'un visage généré par ordinateur ? Bonomi et Boato abordent cette question en proposant et en appliquant une analyse de signal physiologique, extraire la fréquence cardiaque de la vidéo du visage humain, et en l'utilisant comme facteur discriminant."
Les auteurs de l'article sont Mattia Bonomi et Giulia Boato, tous deux de l'Université de Trente, Département d'ingénierie et d'informatique, Trente, Italie.