Action Schema Networks (ASNets) pourrait hypothétiquement permettre à un robot d'apprendre à naviguer dans un étage avec 10 pièces, et ensuite pouvoir errer sur un étage avec des milliers de pièces. Crédit :Université nationale australienne
Des chercheurs de l'Australian National University (ANU) ont conçu un nouveau type de système intelligent basé sur l'apprentissage en profondeur qui peut apprendre à résoudre des problèmes de prise de décision, y compris des problèmes plus complexes que ceux pour lesquels il a été formé.
L'apprentissage en profondeur est une technique d'intelligence artificielle populaire pour des tâches telles que la création de légendes pour décrire des images, transcrire la parole en texte et apprendre à jouer à des jeux vidéo ou de société à partir d'images seules.
Le chercheur principal Sam Toyer a déclaré que le système, appelés Action Schema Networks (ASNets), pourrait hypothétiquement permettre à un robot d'apprendre à naviguer dans un étage de 10 pièces, et ensuite pouvoir errer sur un étage avec des milliers de pièces.
"La capacité d'ASNets à résoudre des problèmes beaucoup plus importants change la donne, " dit M. Toyer, qui a développé ASNets dans le cadre de sa thèse au cours de son baccalauréat en informatique avancée (recherche et développement) à l'ANU et a reçu une médaille universitaire.
"En utilisant notre système basé sur ASNet, nous pourrions potentiellement créer de nouvelles applications de cybersécurité qui détectent les vulnérabilités du système, ou concevoir de nouveaux logiciels de robotique pour effectuer des tâches spécialisées dans des entrepôts automatisés ou des missions spatiales sans pilote."
M. Toyer a déclaré que les systèmes intelligents s'appuyaient sur une technologie de planification automatisée pour prendre des décisions.
"Que ce soit un rover martien choisissant où prendre des photos, ou un réseau intelligent décidant comment isoler un défaut, vous avez besoin d'un algorithme de planification pour choisir le meilleur plan d'action."
M. Toyer a déclaré que certains systèmes basés sur l'apprentissage en profondeur, dont AlphaGo, avait été utilisé pour résoudre des problèmes de prise de décision.
"AlphaGo, qui a atteint une habileté surhumaine dans le jeu de Go, est un exemple récent et bien connu, " il a dit.
"Toutefois, les systèmes comme AlphaGo ne peuvent jouer au jeu que sur une taille de plateau fixe.
"En revanche, Les ASNets peuvent apprendre à résoudre des problèmes de taille variable. Cela leur permet d'apprendre rapidement ce qu'ils doivent savoir sur de petits, problèmes faciles, puis transférez ces connaissances directement à des problèmes beaucoup plus vastes sans recyclage."
Le co-chercheur, le Dr Felipe Trevizan de l'ANU et Data61 du CSIRO, a déclaré qu'ASNet n'était pas en concurrence avec un adversaire comme AlphaGo le fait.
"Plutôt, il est spécialisé dans la résolution de problèmes dans des environnements dynamiques et incertains, " il a dit.
Professeur Sylvie Thiébaux, l'un des universitaires de l'ANU encadrant la thèse de M. Toyer, a déclaré que la recherche était une preuve de concept, qui pourrait être développé avec l'industrie pour être utilisé dans la robotique intelligente pour effectuer des tâches de manière autonome dans un large éventail de paramètres.
Elle a dit que le système a appris à jouer à un jeu pour organiser jusqu'à 35 blocs dans une formation particulière, n'ayant reçu que 25 problèmes utilisant jusqu'à neuf blocs dans le cadre de sa formation.
"Nous avons donné à ASNets une description du jeu, quelques exemples de plans pour des problèmes simples avec un petit nombre de blocs, et puis il a appris à résoudre des problèmes beaucoup plus complexes, " a déclaré le professeur Thiébaux de l'École de recherche en informatique de l'ANU.
Professeur agrégé Lexing Xie de l'ANU Research School of Computer Science, qui a co-dirigé la thèse de M. Toyer, a déclaré qu'ASNets était un moyen créatif d'utiliser l'apprentissage en profondeur.
"Ce travail est le premier à emprunter des conceptions de reconnaissance visuelle pour résoudre des problèmes de prise de décision qui semblent de nature très différente, mais partagent des structures logiques, " elle a dit.