• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Des chercheurs explorent le traitement du langage naturel pour évaluer les mouvements d'échecs

    Pipeline complet pour la formation du modèle d'évaluation. Crédit :arXiv : 1907.08321 [cs.LG]

    Les échecs et l'IA sont à nouveau dans l'actualité, cette fois dans des rapports sur une équipe qui explore un modèle pour les échecs via le traitement du langage naturel (NLP). Le mécanisme d'apprentissage était le bavardage d'échecs – un bavardage bien choisi. Ils se sont pré-formés sur les sentiments de commentaire associés aux mouvements d'échecs. Les sentiments ont guidé la prise de décision de l'agent.

    Leur algorithme d'échecs résultant a été conçu pour évaluer la qualité des mouvements d'échecs en analysant la réaction de commentateurs experts.

    Les trois chercheurs de l'University College London ont rédigé un article décrivant leurs méthodes et leurs résultats. Isaac Kamlish, Isaac Chocron et Nicholas McCarthy ont écrit « SentiMATE :apprendre à jouer aux échecs grâce au traitement du langage naturel, " et c'est sur arXiv. L'article a été soumis le mois dernier.

    "Nous présentons SentiMATE, un nouveau modèle d'apprentissage profond de bout en bout pour les échecs, utilisant le traitement du langage naturel qui vise à apprendre une fonction d'évaluation efficace évaluant la qualité du mouvement. Cette fonction est pré-entraînée sur le sentiment de commentaire associé aux mouvements d'entraînement, et est utilisé pour guider et optimiser la prise de décision de jeu de l'agent."

    N'invitez pas AlphaZero et ce modèle PNL à la même fête; ils resteraient dans les côtés opposés de la pièce. Les chercheurs ont écrit que l'AlphaZero de Deep Mind avait réussi "après des millions d'itérations d'auto-jeu et en utilisant des milliers d'unités de traitement tensoriel (TPU)". Ce n'était pas le cas dans la nouvelle recherche.

    Au lieu, ils ont dit, ils visaient "à aborder l'évaluation de la qualité des mouvements individuels grâce à l'utilisation du traitement du langage naturel... Les données de différents sites Web d'échecs ont été grattées, qui comprenait des informations concernant les mouvements effectués, et une évaluation qualitative des coups eux-mêmes sous forme de commentaire, écrit par un large éventail de joueurs d'échecs; résultant en une grande base de données de mouvements avec des commentaires annotés."

    "Il évalue la qualité des coups d'échecs en analysant la réaction des commentateurs experts, " dit Will Knight, Examen de la technologie du MIT .

    Les chercheurs ont supprimé les commentaires qui ne concernaient pas des mouvements de haute qualité et des exemples trop ambigus, il ajouta. "Ensuite, ils ont utilisé un type spécial de réseau de neurones récurrents et d'inclusions de mots (une technique mathématique qui relie les mots sur la base de leur signification), formés sur un autre modèle de pointe pour l'analyse du langage."

    L'algorithme, appelé SentiMATE, a élaboré par lui-même les règles de base des échecs ainsi que plusieurs stratégies clés, notamment le fork et le roque.

    L'équipe a découvert que SentiMATE était capable d'évaluer les mouvements d'échecs "sur la base d'une fonction d'évaluation des sentiments pré-entraînée". Ils ont conclu qu'il existait des preuves solides à l'appui de l'utilisation du traitement du langage naturel pour entraîner une fonction d'évaluation dans les moteurs d'échecs.

    Les performances de leur solution étaient loin d'être spectaculaires. Chevalier a dit, "il n'a pas réussi à battre certains bots d'échecs conventionnels de manière cohérente." Cette, cependant, ne doit pas détourner l'attention du fait que SentiMATE a fonctionné, et la manière dont cela a fonctionné :

    "SentiMATE a surpris les chercheurs avec sa capacité à élaborer certains des principes de base des échecs ainsi que plusieurs stratégies clés, comme la fourche (lorsque deux pièces ou plus sont menacées simultanément) et le roque (lorsque le roi et le château se déplacent tous les deux vers une position plus défensive au dos du plateau, ", ont déclaré les auteurs.

    Le point important à retenir réside dans les efforts déployés pour concevoir un tel programme :le langage peut-il servir à enseigner comment jouer aux échecs avec moins de données de pratique requises que dans les approches conventionnelles ?

    Tibi Puiu dans ZME Science pensé à ça :

    "Seulement cette fois, leur programme d'apprentissage automatique n'a pas pratiqué des millions de parties pour maîtriser les échecs, mais a plutôt analysé le langage de commentateurs experts. Un jour, les chercheurs disent qu'une approche similaire pourrait permettre aux machines de déchiffrer le langage émotionnel et d'acquérir des compétences qui auraient autrement été inaccessibles par la « force brute ».

    Quant au modèle n'étant pas un super champion d'échecs, il a dit, "La performance de haut niveau n'était pas son objectif, bien que. Là où SentiMATE brille, c'est dans sa capacité à utiliser le langage pour acquérir une compétence au lieu de la pratiquer."

    Dans leur papier, les auteurs ont parlé de l'ensemble de données très important pour soutenir leur recherche. « Lors du nettoyage et de la classification de l'ensemble de données sur la base des commentaires, bitifier les coups d'échecs, et en appliquant l'analyse des sentiments au commentaire, nous présentons à SentiChess un jeu de données de 15, 000 coups d'échecs représentés au format bit, aux côtés de leurs commentaires et de leur évaluation des sentiments. Cet ensemble de données est proposé dans l'espoir de développer davantage le travail autour des modèles d'échecs basés sur les sentiments, et l'analyse statistique des mouvements."

    Avancer, Will Knight a déclaré que le bavardage lié au jeu pourrait aider les programmes d'IA à apprendre à jouer au jeu d'une nouvelle manière. Et, au-delà des échecs, "la même technique pourrait permettre aux machines d'utiliser le contenu émotionnel de notre langage pour maîtriser diverses tâches pratiques."

    (Comme le Examen de la technologie du MIT le sous-titre le dit, "Les machines qui apprécient les mouvements d'échecs " brillants " et " stupides " pourraient apprendre à jouer au jeu et à faire d'autres choses plus efficacement. ")

    © 2019 Réseau Science X




    © Science https://fr.scienceaq.com