Un exemple de la façon dont un Amazon Alexa pourrait déterminer l'emplacement d'une personne dans une maison. Crédit :Romit Roy Chowdhury
Haut-parleurs intelligents—pensez, un Amazon Alexa ou un Google Home—offrent une grande variété de fonctionnalités pour nous aider à libérer notre temps et nos mains. On entend les nouvelles du matin en se brossant les dents, demander un bulletin météo en choisissant un manteau, et réglez une minuterie pour le four tout en manipulant deux casseroles chaudes à la fois. Selon Voicebot.ai, Alexa prend en charge plus de 100, 000 compétences dans le monde, mais une tâche qu'il n'a pas maîtrisée est de déterminer l'emplacement de l'utilisateur dans la maison.
Cette tâche de localisation était au centre d'un article récemment publié par une équipe de recherche de l'Université de l'Illinois à Urbana-Champaign, "Localisation de la voix à l'aide de réflexions murales à proximité." Le travail a été accepté à la 26e Conférence internationale annuelle sur l'informatique mobile et les réseaux. Dans le journal, l'équipe, dirigée par l'étudiant diplômé du Coordinated Science Lab, Sheng Shen, explore le développement de VoLoc, un système qui utilise le réseau de microphones sur Alexa, ainsi que les échos de la voix humaine, pour déduire l'emplacement de l'utilisateur à l'intérieur de la maison.
Connaître l'emplacement d'un utilisateur dans une maison pourrait aider un appareil intelligent à mieux prendre en charge les compétences actuellement disponibles. Par exemple, après avoir reçu des commandes comme "allumer la lumière" ou "augmenter la température, " Alexa doit actuellement deviner quelle lumière et quelle pièce sont au cœur de la commande. En utilisant une technique connue sous le nom de triangulation inverse, Shen et son conseiller Romit Roy Choudhury se rapprochent de la localisation vocale.
"L'application de cette technique aux haut-parleurs intelligents comporte de nombreux défis, " a partagé Shen, un étudiant en génie électrique et informatique (ECE). "D'abord, nous devons séparer la voix humaine directe et chacun des échos de la pièce de l'enregistrement du microphone. Puis, nous devons calculer avec précision la direction de chacun de ces échos. Les deux défis sont difficiles car les microphones enregistrent simplement un mélange de tous les sons."
VoLoc résout ces obstacles grâce à un "algorithme d'alignement et d'annulation" qui isole de manière itérative les directions de chacun des signaux vocaux arrivants, et d'eux, inverse triangule l'emplacement de l'utilisateur. Certains aspects de la géométrie de la pièce s'apprennent spontanément, qui aide ensuite à la triangulation. Bien qu'il s'agisse d'une percée importante, Shen et Roy Choudhury prévoient d'étendre bientôt la recherche à d'autres applications.
"Notre prochaine étape immédiate est de construire le cadre de référence de l'enceinte intelligente, " expliqua Shen. " Cela pourrait signifier superposer les lieux, tel que fourni par VoLoc, sur un plan d'étage pour déterminer que l'utilisateur se trouve dans la buanderie. Alternativement, si le haut-parleur intelligent capte les sons émis par la laveuse et la sécheuse au même endroit que la commande vocale, il peut arriver à la même conclusion.
Les possibilités de cette fonction sont apparemment infinies et pourraient améliorer les capacités actuelles d'Alexa.
« Les implications sont importantes, " dit Roy Choudhury, un professeur CSL et le W.J. "Jerry" Sanders III—Advanced Micro Devices, Inc. Boursier en génie électrique et informatique. "La localisation peut aider Alexa à améliorer la reconnaissance vocale, puisque différents vocabulaires et modèles vocaux peuvent être chargés. Par exemple, une commande comme 'ajouter urgent à la liste de courses' peut ne pas avoir de sens, mais si Alexa sait que l'utilisateur est dans la buanderie, Alexa pourra peut-être en déduire que l'utilisateur a en fait dit "ajouter du détergent à la liste de courses".
Shen et Roy Choudhury reconnaissent que la technologie pourrait éroder davantage la vie privée, en permettant à des entreprises comme Amazon et Google de s'intéresser de plus près à nos maisons et à notre vie quotidienne. Cependant, ils croient également que les avantages sont vitaux, car les appareils intelligents contextuels pourraient devenir des technologies de soutien cruciales pour la vie autonome des personnes âgées et plus encore.
Par exemple, la technologie pourrait être utilisée pour rappeler à un grand-parent qui vit de façon autonome de prendre ses médicaments lorsqu'il passe devant l'armoire à pharmacie, ou pour rappeler à un enfant de fermer le robinet lorsqu'il sort de la salle de bain alors qu'il coule toujours.
"C'est plus que d'interpréter des commandes vocales, ", a déclaré Shen. "Cela fournit également une paire d'yeux supplémentaire lorsqu'il s'agit de prendre soin de ses proches."