• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Quand le petit robot parcourra vos chambres pour trouver le sac orange

    Crédit :embodedqa.org

    Hmm, il était une fois, nous avons été impressionnés par le fait que ce phénomène de recherche appelé Google pouvait répondre instantanément aux questions et c'est simplement en tapant des mots dans une barre d'espace. Mirabile dictu si vous demandiez où est Miani Google riposte, Vouliez-vous dire Miami ?

    La scène des questions-réponses a fait un bond en avant et maintenant les scientifiques travaillent à un autre niveau où les systèmes intelligents voient, plan, et raisonner la réponse.

    La réponse à la question intégrée est le nom d'un projet et le titre d'un article sur arXiv. Les six auteurs, avec les affiliations du Georgia Institute of Technology et de Facebook AI Research, décrivent leur travail englobant une gamme de compétences en IA.

    IncorporéQA, comme on l'appelle, charge les agents de naviguer dans des environnements 3-D riches afin de répondre aux questions. Will Knight, Examen de la technologie du MIT , fait référence à ce "défi de chasse au trésor".

    Ces agents doivent apprendre conjointement la compréhension de la langue, raisonnement visuel, et une navigation axée sur les objectifs pour réussir.

    De quoi s'agit-il :un agent est généré à un emplacement aléatoire dans un environnement 3D. Une question est posée à l'agent (« De quelle couleur est la voiture ? »). Pour avoir la réponse, l'agent doit naviguer pour explorer l'environnement, recueillir des informations grâce à une « vision à la première personne (égocentrique), " puis répondez.

    L'équipe a développé un ensemble de données de questions et réponses dans les environnements House3D. (Vous pouvez en savoir plus sur House3D un environnement 3D virtuel, sur GitHub).

    Leur article donne plus de détails sur les types de questions et les modèles dans l'ensemble de données EQA. emplacement :quelle chambre ? De quelle couleur est l'objet ? Ce qu'il y a au dessus, au dessous de, à côté de, L'object? Existence :Y a-t-il un objet dans la pièce ? Combien de? L'objet 1 est-il plus proche de l'objet 2 que de l'objet 3 ?

    Les questions testent les capacités :détection d'objets, reconnaissance de scène, compte, raisonnement spatial, reconnaissance des couleurs et logique.

    Aussi, les auteurs ont déclaré que « EQA est facilement extensible pour inclure de nouvelles opérations élémentaires, types de questions, et des modèles au besoin pour augmenter la difficulté de la tâche en fonction du développement."

    Les auteurs ont souligné que l'EQA n'est pas un ensemble de données statique. Plutôt, c'est un test pour "un programme de capacités que nous aimerions atteindre dans les agents de communication incarnés."

    Pourquoi cela est important : Entreprise rapide a noté que ce projet Facebook et Georgia Tech forme en fait des systèmes d'intelligence artificielle pour analyser des questions de langage naturel et trouver des objets spécifiques.

    Pourquoi c'est important, à Will Knight dans Examen de la technologie du MIT :"Imaginez demander à un Roomba d'aller passer l'aspirateur dans la chambre. Même si la machine pouvait comprendre votre voix et voir son environnement, il n'a aucune idée de ce qu'est une chambre, ou où l'on pourrait en trouver. Mais les futurs robots domestiques pourraient utiliser un logiciel d'IA qui a appris des faits si simples sur les maisons ordinaires en explorant d'abord de nombreuses maisons virtuelles. »

    Comment les chercheurs ont-ils fait ? Daniel Terdiman dans Entreprise rapide a écrit que l'équipe "a utilisé de nombreux types d'apprentissage automatique pour former les robots à répondre aux questions sur la maison virtuelle".

    « L'apprentissage » est une partie importante de ce que l'équipe a accompli. L'agent a appris ce que Knight a appelé "une forme rudimentaire de bon sens". Avec essais et erreurs, il a trouvé les meilleurs endroits pour chercher l'objet en question. Peut-être, par exemple, l'agent apprend que les voitures se trouvent généralement dans le garage. Il peut comprendre que les garages sont par la porte avant ou arrière.

    © 2018 Tech Xplore




    © Science https://fr.scienceaq.com