Lorsque des enfants sont victimes de crimes, le témoignage juridique qu'ils fournissent est connu sous le nom d'entretiens médico-légaux. Cependant, étant donné que les victimes sont souvent traumatisées et potentiellement maltraitées par leurs soignants, elles peuvent être réticentes à porter des accusations ou à divulguer des informations pertinentes.
En tant que tel, un protocole a été élaboré pour extraire soigneusement autant d'informations pertinentes que possible sur un crime. Encore, Et si l'intelligence artificielle pouvait être un outil utile pour aider les jeunes victimes à raconter leur histoire ? Et si l'IA pouvait soutenir les enquêteurs avec des outils pour aider à recueillir des informations de manière appropriée ?
C'est le sujet d'un article présenté à la Conférence internationale ACM 2018 sur l'interaction multimodale, récemment à Boulder, Colorado.
Le papier, présenté par des doctorants du Laboratoire d'analyse et d'interprétation du signal de l'USC Viterbi School of Engineering, Victor Ardulov et Manojkumar Prabakaran Abitha, avec le fondateur de SAIL Shri Narayanan, documente un effort multidisciplinaire en collaboration avec le professeur de l'USC Gould School of Law, et expert enfant témoin, Thomas D. Lyon et son équipe, déterminer si et comment les outils informatiques peuvent évaluer avec précision la productivité des entretiens médico-légaux. En outre, l'article documente comment les chercheurs ont tenté d'identifier les influences linguistiques et paralinguistiques potentielles telles que les émotions dans le processus d'entretien.
Ardulov, qui est l'auteur principal de l'article présenté lors de la récente conférence de l'ACM, a déclaré que le but de l'étude était de recueillir des commentaires sur la façon dont les enfants ont tendance à répondre en fonction de subtiles variations dans les questions.
Le défi pour les enquêteurs médico-légaux est de poser les bonnes questions, de la bonne manière, au bon moment afin de garantir que les victimes reçoivent des informations pertinentes et impartiales sur les crimes perpétrés. Ceci est particulièrement important lorsque les enfants peuvent être les seuls témoins d'un crime. La clé est de maximiser la productivité sans re-traumatiser l'enfant ou forcer un témoignage inexact.
Des universitaires comme Lyon, qui a créé le Gould Child Interviewing Lab de l'USC, sont conscients de la façon dont le rapport s'est établi entre l'intervieweur et la personne interrogée, le ton sur lequel les questions sont posées, les pauses et même l'ordre des questions peuvent avoir un impact sur la quantité d'informations significatives partagées. Cependant, on pense qu'il s'agit de la première tentative de développement et d'application d'un logiciel personnalisé pour détecter et catégoriser automatiquement les modèles de parole au cours des entretiens médico-légaux.
Depuis plus de deux décennies, Narayanan a développé des technologies de la parole et du langage pour sous-estimer la parole et le langage des enfants, et dans le développement d'interfaces conversationnelles primées basées sur l'IA pour les enfants. Il dit "... la science des données et les techniques de calcul fondées sur la linguistique offrent un riche ensemble d'outils pour aider à comprendre non seulement ce qu'un enfant essaie de communiquer, mais son état émotionnel et cognitif. Ce sont les technologies de notre laboratoire [SAIL] à USC essaie de se développer avec nos collaborateurs."
Narayanan de Viterbi a rencontré Lyon de Gould il y a une dizaine d'années lors d'un atelier collaboratif multidisciplinaire entre professeurs de l'USC. Les deux n'ont commencé à travailler sur ce projet qu'il y a environ un an et demi avec les candidats au doctorat de Narayanan, Ardulov et Manoj Kumar, qui ont pris l'initiative de trouver des moyens de quantifier des facteurs particuliers dans le discours qui pourraient affecter le résultat de l'entretien, tels que la fréquence ou la durée des les pauses d'un intervieweur, le temps imparti à un enfant pour répondre, et la mesure dans laquelle le rythme du discours de l'enquêteur reflète le discours de l'enfant interrogé.
Lyon s'est intéressé au travail de Narayanan avec l'espoir que « la technologie peut saisir les subtilités d'un entretien - qualités, qui sont plus difficiles à saisir et à compter."
Conclusions de l'article présenté
Les transcriptions audio anonymes de deux cents entretiens médico-légaux que Lyon a recueillis sur des cas de maltraitance d'enfants ont été transcrites à partir de fichiers audio, puis codées pour diverses dimensions. Les chercheurs du SAIL Lab, qui a déjà développé des outils pour analyser automatiquement la parole (comme qui a parlé et pendant combien de temps) et les aspects comportementaux riches (comme les émotions), ainsi que la façon dont les gens interagissent les uns avec les autres, développé des modèles personnalisés pour chaque entretien. Une fois cela fait, les chercheurs chercheraient alors des modèles dans les entretiens et dans l'interaction entre l'intervieweur et la personne interrogée.
En général, les conclusions des chercheurs sont cohérentes avec les études antérieures dans le domaine de la psychologie juridique. Les entretiens se déroulent normalement en deux phases :une phase d'établissement de relations sans rapport avec le crime ou l'abus, puis un deuxième entretien s'est concentré sur les abus allégués. Dans cette étude, la façon dont les enfants ont répondu à ces entretiens était fortement corrélée à leur âge. Pour les plus jeunes, le contenu émotionnel des mots de l'intervieweur a eu un impact sur la quantité d'informations qu'il était disposé à partager pendant la phase de l'interview. Les enfants plus âgés étaient plus influencés par la façon dont l'intervieweur a vocalisé leurs mots (le ton et le volume).
Prochaines étapes
L'espoir est qu'un assistant informatique pour les entretiens puisse prendre différentes formes. D'abord, cela pourrait être un moyen de former des enquêteurs médico-légaux, soit au moyen d'un assistant virtuel qui informe les enquêteurs lors d'une interaction, ou comme une simulation d'entretien avec un enfant.
Ces deux approches reposent sur la disponibilité de grands ensembles de données d'interactions questions-réponses et de modèles mathématiques rigoureux sur la façon dont les enfants répondent et sont influencés par les entrées des intervieweurs. C'est apparenté, Ardulov dit, à la façon dont Google complète automatiquement les phrases que vous saisissez et propose des suggestions basées sur le grand nombre d'entrées historiques.
Lyon imagine que ces modèles pourraient être d'excellents outils pour ceux qui travaillent en tant que défenseurs des enfants. « Il pourrait fournir des informations supplémentaires pour structurer et affiner les protocoles, " il dit.
Lyon dit, « Imaginez une transcription automatisée d'une interview dans laquelle un intervieweur tenant un iPad obtient les mots ou les phrases surlignés qui pourraient éclairer sa prochaine question et guider l'entretien. »
Il ajoute que ce serait un moyen pour les entretiens de ne pas avoir à utiliser de notes, et le logiciel lui-même pourrait signaler d'éventuelles contradictions et incohérences.
Pour ce faire, la prochaine phase de recherche serait de créer des modèles plus sophistiqués dans lesquels les chercheurs examineraient des interactions spécifiques, ou des séquences particulières de questions pour comprendre ce qui donne les informations les plus pertinentes d'un enfant.