Une approche de la mémoire générative pour permettre un apprentissage par renforcement tout au long de la vie

Crédit :Raghavan, Hostetler &Chai.

L'une des principales limites des systèmes d'intelligence artificielle (IA) existants est qu'ils sont incapables de s'attaquer à des tâches pour lesquelles ils n'ont pas été formés. En réalité, même quand ils sont recyclés, la majorité de ces systèmes sont sujets à « l'oubli catastrophique, ' ce qui signifie essentiellement qu'un nouvel élément peut perturber leurs connaissances précédemment acquises.

Par exemple, si un modèle est initialement formé pour accomplir la tâche A, puis recyclé par la suite sur la tâche B, ses performances sur la tâche A pourraient diminuer considérablement. Une solution naïve serait d'ajouter à l'infini plus de couches neuronales pour prendre en charge des tâches supplémentaires ou des éléments en cours de formation, mais une telle approche ne serait pas efficace, ou même fonctionnellement évolutif.

Des chercheurs de SRI international ont récemment tenté d'appliquer des mécanismes de transfert de mémoire biologique aux systèmes d'IA, car ils pensent que cela pourrait améliorer leurs performances et les rendre plus adaptatifs. Leur étude, prépublié sur arXiv, s'inspire des mécanismes de transfert de mémoire chez l'homme, comme la mémoire à long terme et à court terme.

"Nous construisons une nouvelle génération de systèmes d'IA qui peuvent apprendre des expériences, " Sek Chai, un co-PI du projet DARPA Lifelong Learning Machines (L2M), a déclaré TechXplore. "Cela signifie qu'ils peuvent s'adapter à de nouveaux scénarios en fonction de leurs expériences. Aujourd'hui, Les systèmes d'IA échouent car ils ne sont pas adaptatifs. Le projet DARPA L2M, dirigé par le Dr Hava Siegelmann, cherche à réaliser des avancées révolutionnaires dans les capacités de l'IA."

Crédit :Raghavan, Hostetler &Chai.

Le transfert de mémoire implique une séquence complexe de processus dynamiques, qui permettent aux humains d'accéder facilement à des souvenirs saillants ou pertinents lors de la réflexion, Planification, créer ou faire des prédictions sur des événements futurs. On pense que le sommeil joue un rôle essentiel dans la consolidation des souvenirs, en particulier le sommeil paradoxal, le stade où le rêve se produit le plus fréquemment.

Dans leur étude, Chai et ses collègues du SRI ont développé un mécanisme de mémoire générative qui peut être utilisé pour entraîner des systèmes d'IA de manière pseudo-répétitive. En utilisant le replay et l'apprentissage par renforcement (RL), ce mécanisme permet aux systèmes d'IA d'apprendre des souvenirs marquants tout au long de leur vie, et à l'échelle avec un grand nombre de tâches ou d'éléments de formation. L'approche de la mémoire générative développée par Chai et ses collègues utilise une méthode de codage pour séparer l'espace latent. Cela permet à un système d'IA d'apprendre même lorsque les tâches ne sont pas bien définies ou lorsque le nombre de tâches est inconnu.

"Notre système d'IA ne stocke pas directement les données brutes, comme la vidéo, l'audio, etc., " Expliqua Chai. " Plutôt, nous utilisons la mémoire générative pour générer ou imaginer ce qu'elle a vécu auparavant. Des systèmes d'IA générative ont été utilisés pour créer de l'art, musique, etc. Dans notre recherche, nous les utilisons pour coder des expériences génératives qui peuvent être utilisées plus tard avec l'apprentissage par renforcement. Une telle approche s'inspire des mécanismes biologiques du sommeil et des rêves, où nous nous souvenons ou imaginons des fragments d'expériences qui sont renforcés dans nos mémoires à long terme."

À l'avenir, la nouvelle approche de mémoire générative introduite par Chai et ses collègues pourrait aider à résoudre le problème de l'oubli catastrophique dans les modèles basés sur les réseaux neuronaux, permettre l'apprentissage tout au long de la vie dans les systèmes d'IA. Les chercheurs testent maintenant leur approche sur des jeux de stratégie sur ordinateur qui sont couramment utilisés pour former et évaluer les systèmes d'IA.

"Nous utilisons des jeux de stratégie en temps réel tels que StarCraft2 pour former et étudier nos agents d'IA sur des mesures d'apprentissage tout au long de la vie telles que l'adaptation, robustesse, et la sécurité, " a déclaré Chai. "Nos agents d'IA sont entraînés avec des surprises injectées dans le jeu (par exemple, le terrain et le changement de capacité d'unité)."

Des ruches contestées arrivent à Barcelone en catimini

Des chercheurs découvrent une trappe dans le système électoral de SwissVote

Électronique