• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Nouvelle méthode proposée pour parvenir à un meilleur auto-apprentissage du robot

    Des chercheurs mènent une expérience sur un robot mobile. Crédit :HU Yanming

    Les êtres humains font preuve d'une incroyable capacité d'adaptation lorsqu'ils font face à des tâches complexes de la vie quotidienne. Cette adaptabilité est l'incarnation directe de la capacité d'apprentissage individuelle, qui permet aux êtres humains d'améliorer leur propre comportement de manière indépendante et progressive.

    Par conséquent, si les robots peuvent avoir cette capacité, ils peuvent générer automatiquement de nouveaux comportements en fonction de l'acquisition en temps réel des données et des cas. Cette capacité montre une intelligence évidente, ce qu'on appelle l'intelligence comportementale.

    Récemment, le chercheur de l'Institut d'automatisation de Shenyang de l'Académie chinoise des sciences a développé une nouvelle méthode a développé une nouvelle méthode pour améliorer l'intelligence comportementale des robots, les résultats connexes ont été publiés sur Transactions IEEE sur les systèmes cognitifs et développementaux .

    Le chercheur a proposé un nouveau cadre de méthode d'apprentissage incrémental basé sur le modèle Q-Learning et le modèle linéaire à noyau adaptatif (AKL). Le framework permet au robot d'apprendre de nouveaux comportements sans oublier les précédents. Sous la nouvelle méthode, les comportements des robots peuvent être évalués au moyen d'un apprentissage autonome et d'un apprentissage par imitation, et la structure et les paramètres du modèle peuvent être modifiés en temps réel à l'aide d'un nouvel algorithme des moindres carrés récursifs du noyau de la norme L2 (L2-KRLS).

    Outre, ils ont mené deux expériences pour valider les performances de la nouvelle méthode. Les résultats ont montré que le cadre proposé peut apprendre progressivement des comportements dans des environnements variés. L'apprentissage Q basé sur des politiques locales gourmandes est plus rapide que les algorithmes d'apprentissage Q existants. Maintenant, cette réalisation a été appliquée à la navigation autonome des robots.


    © Science https://fr.scienceaq.com