• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Des chercheurs utilisent des jeux vidéo pour débloquer de nouveaux niveaux d'IA

    Crédit :CC0 Domaine public

    Les attentes vis-à-vis des intelligences artificielles sont très réelles et très élevées. Une analyse dans Forbes projette les revenus de l'IA. passera de 1,62 milliard de dollars en 2018 à 31,2 milliards de dollars en 2025. Le rapport comprend également une enquête révélant que 84 % des entreprises pensent investir dans l'IA. conduira à des avantages concurrentiels.

    « C'est passionnant de voir les énormes succès et les progrès réalisés ces dernières années, " dit Daniel Jiang, professeur adjoint de génie industriel à la Swanson School of Engineering de l'Université de Pittsburgh. « Pour poursuivre cette tendance, nous cherchons à développer des méthodes plus sophistiquées pour les algorithmes afin d'apprendre des stratégies pour une prise de décision optimale."

    Le Dr Jiang conçoit des algorithmes qui apprennent des stratégies de décision dans des environnements complexes et incertains. En testant des algorithmes dans des environnements simulés, ils peuvent apprendre de leurs erreurs tout en découvrant et en renforçant les stratégies de réussite. Pour parfaire ce procédé, Le Dr Jiang et de nombreux chercheurs dans son domaine ont besoin de simulations qui reflètent le monde réel.

    "En tant qu'ingénieurs industriels, nous travaillons généralement sur des problèmes avec une orientation opérationnelle. Par exemple, transport, logistique et chaînes d'approvisionnement, les systèmes énergétiques et les soins de santé sont plusieurs domaines importants, " dit-il. " Tous ces problèmes sont des opérations à enjeux élevés avec des conséquences réelles. Ils ne créent pas les meilleurs environnements pour essayer des technologies expérimentales, surtout quand bon nombre de nos algorithmes peuvent être considérés comme des moyens intelligents d'"essais et d'erreurs" répétés sur toutes les actions possibles."

    Une stratégie pour préparer l'IA avancée. affronter des scénarios et des complications du monde réel consiste à utiliser des données historiques. Par exemple, les algorithmes pouvaient parcourir des décennies de données pour trouver quelles décisions étaient efficaces et lesquelles conduisaient à des résultats moins qu'optimaux. Cependant, les chercheurs ont trouvé difficile de tester des algorithmes conçus pour apprendre des comportements adaptatifs en utilisant uniquement des données du passé.

    Le Dr Jiang explique, "Les données historiques peuvent être un problème parce que les actions des gens corrigent les conséquences et ne présentent pas de possibilités alternatives. En d'autres termes, il est difficile pour un algorithme de poser la question « en quoi les choses seraient-elles différentes si je choisissais la porte B au lieu de la porte A ? » Dans les données historiques, tout ce que nous pouvons voir, ce sont les conséquences de la porte A."

    Jeux vidéo, comme alternative, offrent des environnements de test riches remplis de prises de décision complexes sans les dangers de mettre une IA immature. pleinement en charge. Contrairement au monde réel, ils fournissent un moyen sûr pour un algorithme d'apprendre de ses erreurs.

    "Les concepteurs de jeux vidéo ne créent pas des jeux dans le but de tester des modèles ou des simulations, " dit le Dr Jiang. " Ils conçoivent souvent des jeux avec une double mission :créer des environnements qui imitent le monde réel et inciter les joueurs à prendre des décisions difficiles. Ces objectifs correspondent également à ce que nous recherchons. Aussi, les jeux sont beaucoup plus rapides. En quelques heures de temps réel, nous pouvons évaluer les résultats de centaines de milliers de décisions de gameplay."

    Pour tester son algorithme, Le Dr Jiang a utilisé un genre de jeux vidéo appelé Multiplayer Online Battle Arena ou MOBA. Des jeux tels que League of Legends ou Heroes of the Storm sont des MOBA populaires dans lesquels les joueurs contrôlent l'un des nombreux personnages "héros" et tentent de détruire les bases des adversaires tout en protégeant les leurs.

    Un algorithme réussi pour entraîner un gameplay A.I. doit surmonter plusieurs défis, telles que la prise de décision en temps réel et les horizons décisionnels longs, un terme mathématique désignant le moment où les conséquences de certaines décisions ne sont connues que bien plus tard.

    "Nous avons conçu l'algorithme pour évaluer 41 éléments d'information, puis générer l'une des 22 actions différentes, y compris le mouvement, attaques et coups spéciaux, " dit le Dr Jiang. "Nous avons comparé différentes méthodes d'entraînement les unes aux autres. Le joueur le plus performant a utilisé une méthode appelée recherche d'arbre Monte Carlo pour générer des données, qui est ensuite introduit dans un réseau de neurones."

    La recherche arborescente Monte Carlo est une stratégie de prise de décision dans laquelle le joueur se déplace de manière aléatoire à travers une simulation ou un jeu vidéo. L'algorithme analyse ensuite les résultats du jeu pour donner plus de poids aux actions les plus réussies. Au fil du temps et des multiples itérations du jeu, plus les actions réussies persistent, et le joueur devient meilleur pour gagner la partie.

    "Notre recherche a également donné des résultats théoriques pour montrer que la recherche arborescente de Monte Carlo est une stratégie efficace pour former un agent à réussir à prendre des décisions difficiles en temps réel, même en opérant dans un monde incertain, " explique le Dr Jiang.

    Le Dr Jiang a publié ses recherches dans un article co-écrit avec Emmanuel Ekwedike et Han Liu et a présenté les résultats à la Conférence internationale 2018 sur l'apprentissage automatique à Stockholm, Suède l'été dernier.

    A l'Université de Pittsburgh, il continue de travailler dans le domaine de la prise de décision séquentielle avec un doctorat. étudiants Yijia Wang et Ibrahim El-Shar. L'équipe se concentre sur les problèmes liés au covoiturage, marchés de l'énergie, et la santé publique. Alors que les industries se préparent à mettre l'IA. en charge des responsabilités critiques, Le Dr Jiang s'assure que les algorithmes sous-jacents restent au sommet de leur art.


    © Science https://fr.scienceaq.com