Ceux qui savent à quel point il est difficile de saisir les mains d'un robot, la poignée et la manœuvre feront plus que jeter un coup d'œil - regarder, plutôt—à la récente vidéo montrant le cube OpenAI Dactyl Rubik.
Travailler avec une main de robot à quatre doigts et un pouce n'est jamais anodin lorsque le défi consiste à démontrer une dextérité humaine. La main d'OpenAI gagne des regards reconnaissants avec ses manipulations habiles du doigt dont une main humaine aurait besoin pour résoudre le cube.
Ceux qui connaissent l'autre vidéo d'OpenAI publiée l'année dernière seraient déjà au courant de leurs avancées, avec la vidéo intitulée Learning Dexterity. La vidéo parlait de leur formation à une main de robot semblable à un humain pour manipuler des objets physiques. Même alors, ils pensaient qu'ils pouvaient se vanter que la main du robot pouvait le faire avec une « dextérité sans précédent ».
C'est ainsi qu'ils ont introduit leur système, Dactyle. Ils ont dit que Dactyl apprend à partir de zéro en utilisant un algorithme et un code d'apprentissage par renforcement à usage général. "Nos résultats montrent qu'il est possible de former des agents à la simulation et de leur faire résoudre des tâches du monde réel, sans modélisation physiquement précise du monde."
Un ingénieur en apprentissage automatique a déclaré aux téléspectateurs que la technique était appelée randomisation de domaine.
Ils ont randomisé la vitesse à laquelle la main peut se déplacer, par exemple, et combien le bloc est lourd, et la friction entre le bloc et la main.
Il y a un an, deux commentaires de la vidéo pensaient qu'il ne s'agissait pas vraiment d'IA :" ' ' ' ' IA ' n'est en fait que des algorithmes abstraits à ce stade. Nous ne sommes même pas près de comprendre ce qu'est l'intelligence, encore moins comment le synthétiser."
L'autre commentaire :"Ce n'est rien de plus qu'une programmation intelligente... pas d'intelligence du tout. C'est simplement une machine qui fait ce pour quoi elle a été programmée de manière détournée. Il suffit de programmer la chose pour tourner les blocs dans le bon sens dès le départ et économisez du temps et des efforts... Un ordinateur ne fera jamais que ce pour quoi il est programmé."
Toujours, Karen Hao dans Examen de la technologie du MIT pensait que la main robotique de l'équipe était une étape importante vers des robots plus agiles pour les applications industrielles et grand public.
Avance rapide vers leur nouveau papier, "Résoudre le Rubik's Cube avec une main de robot."
Les auteurs ont expliqué que « Nous démontrons que des modèles entraînés uniquement en simulation peuvent être utilisés pour résoudre un problème de manipulation d'une complexité sans précédent sur un robot réel. Cela est rendu possible par deux composants clés :un nouvel algorithme, que nous appelons la randomisation automatique de domaine (ADR) et une plate-forme robotique conçue pour l'apprentissage automatique."
Ils ont parlé de leur rotation combinée flip et top face.
"Une rotation correspond à la rotation d'une seule face du Rubik's cube de 90 degrés dans le sens des aiguilles d'une montre ou dans le sens inverse des aiguilles d'une montre. Un retournement correspond au déplacement d'une autre face du Rubik's cube vers le haut. Nous avons constaté que la rotation de la face supérieure était loin plus simple que la rotation d'autres faces. au lieu de faire pivoter des visages arbitraires, nous combinons ensemble un retournement et une rotation de la face supérieure afin d'effectuer l'opération souhaitée. Ces sous-objectifs peuvent ensuite être exécutés de manière séquentielle pour éventuellement résoudre le Rubik's cube."
Ils ont répondu à tous les soupçons qu'ils se sont donnés un avantage injuste avec un cube idéalement brouillé.
"La difficulté de résoudre un Rubik's cube dépend évidemment de combien il a été brouillé auparavant. Nous utilisons la méthode de brouillage officielle utilisée par la World Cube Association pour obtenir ce qu'ils appellent un brouillage équitable (environ 20 mouvements appliqués à un a résolu le Rubik's cube pour le brouiller).
Qu'ont pensé les autres roboticiens de la main de l'équipe OpenAI avec le casse-tête Rubik's ?
Hao a cité Dmitry Berenson, un roboticien à l'Université du Michigan.
"C'est un problème très difficile, " a-t-il dit. " Le genre de manipulation nécessaire pour faire pivoter les pièces du Rubik's cube est en fait beaucoup plus difficile que de faire pivoter un cube. "
Mais que veut dire l'équipe lorsqu'elle se réfère à des modèles entraînés à la simulation ? Karen Hao dans Examen de la technologie du MIT ont déclaré avoir construit un modèle virtuel de leur robot. Ils l'entraînent virtuellement pour accomplir la tâche à accomplir. "L'algorithme apprend dans la sécurité de l'espace numérique et peut ensuite être porté dans un robot physique." Maintenant, la clé de leur succès :Ho a déclaré que « le laboratoire a brouillé les conditions simulées à chaque cycle de formation pour rendre l'algorithme plus adaptable aux différentes possibilités ».
Ils ont utilisé la (1) main Shadow Dexterous E Series comme main de robot, (2) le système de capture de mouvement PhaseSpace pour suivre les coordonnées cartésiennes du bout des doigts et (3) trois caméras RGB Basler ont été utilisées pour l'estimation de la pose de la vision.
Et après?
Dans un blog, Les membres de l'équipe ont déclaré que "Résoudre le Rubik's Cube avec une main de robot n'est toujours pas facile. Notre méthode résout actuellement le Rubik's Cube 20% du temps lors de l'application d'un brouillage extrêmement difficile qui nécessite 26 rotations de visage. Pour des brouillages plus simples qui nécessitent 15 rotations pour annuler, le taux de réussite est de 60 %.
Néanmoins, OpenAI ne consiste pas à s'éloigner de la difficulté. "Nous pensons que la dextérité humaine est sur la voie de la construction de robots polyvalents et nous sommes ravis d'aller de l'avant dans cette direction."
© 2019 Réseau Science X