Les IBM débattent de l'ordinateur :un verdict d'experts en IA

Crédit :IBM

La compétition a commencé lorsque la voix féminine de l'ordinateur, un mélange d'Alexa d'Amazon et du communicateur de Stephen Hawking, a parlé à son adversaire humain:"Bonjour Noa. Nous nous reverrons."

J'étais le seul universitaire invité dans la salle bondée d'une cinquantaine de journalistes pour assister au récent concours entre l'intelligence artificielle du Project Debater d'IBM et les champions du débat israélien Noa Ovadia et Dan Zafrir. Le gambit d'ouverture a produit des rires et des roulements d'yeux de la part du public. J'étais plus un fanatique – je ne suis pas convaincu qu'un matériel pré-scénarisé évident aide vraiment la cause de la présentation des technologies d'IA. Ce qui a suivi était indéniablement un exploit d'ingénierie impressionnant, mais il est peut-être trop facile de penser que l'IA de science-fiction est maintenant au coin de la rue.

Project Debater fait suite à l'annonce que Google a développé une technologie d'IA connue sous le nom de Duplex qui peut mener des conversations téléphoniques naturelles afin de prendre des rendez-vous et d'effectuer d'autres tâches. Les deux projets semblent impliquer une IA proche de la compétence humaine, qui pourrait passer le test de Turing, et dominer le monde de façon imminente, peut-être. Mais c'est une illusion née du marketing prudent de ces énormes sociétés. La réalité est que nous n'en sommes encore qu'aux premiers jours de la compréhension de l'IA.

Après les tactiques initiales qui plaisent à la foule, L'ordinateur d'IBM produisit un discours de quatre minutes, à la volée, sur un sujet choisi au hasard parmi une liste de 40 sur lesquels il n'avait pas encore été formé pour débattre. Il l'a fait en identifiant, classement, sélectionner puis assembler des extraits d'une bibliothèque de 300 millions d'articles de presse. Le résultat était largement grammaticalement correct, sémantiquement sur le message et plus ou moins cohérent. Le système était alors capable d'écouter et de répondre à une déclaration similaire de son adversaire humain.

Cela vaut peut-être la peine de réfléchir à la difficulté de ces tâches. Tenir une conversation est extrêmement difficile une fois que vous allez au-delà de très structuré, domaines étroitement contrôlés. Systèmes d'apprentissage en profondeur, inspiré du cerveau humain, essaient de mapper tout ce que l'humain dit à un nombre relativement petit de mouvements possibles avec un petit nombre de valeurs possibles. Google Duplex fonctionne toujours dans un domaine spécifique, comme réserver le dîner, et peut donc être très robuste.

Se disputer est encore plus exigeant. Il est remarquablement difficile de construire un algorithme pour déterminer de manière fiable si une phrase donnée soutient ou non votre position. A un niveau, l'équipe IBM a réussi, avec Project Debater produisant sa déclaration cohérente et convaincante de quatre minutes. J'ai également été très impressionné par la qualité de la structure grammaticale de l'ordinateur, d'autant plus que chaque phrase peut avoir été tirée de plusieurs articles de la bibliothèque.

La technologie encore limitée

Pourtant, au fur et à mesure du discours, J'ai eu la nette impression que la structure thématique était en train de s'effondrer, avec le flux fluctuant entre les sujets. La machine a terminé à quatre minutes de la fin avec une belle rhétorique consistant à anticiper et à attaquer l'argument de l'adversaire (connu sous le nom de procatalepsis). Mais plus tard, la réfutation de deux minutes de l'ordinateur à son adversaire humain ressemblait de plus en plus à une simple répétition.

Project Debater a réalisé de nouvelles avancées significatives dans des domaines tels que la recherche de textes pour des arguments (extraction d'arguments) couplée à des solutions techniques telles que la réparation grammaticale qui implique le collage de parties de phrases ensemble. Mais, comme orateur, l'ordinateur fait encore ses premiers petits grincements.

Le système n'a que la notion la plus rudimentaire de la structure de l'argument et s'écarte si souvent du thème principal. Il ne fait pas attention à son public, ni son adversaire, et n'a aucun moyen d'adapter son langage ou d'exploiter l'une des centaines de techniques rhétoriques intelligentes qui aident à conquérir le public

Ni IBM ni Google ne prétendent, voire intimidant, qu'ils ont résolu tous les problèmes d'IA, ou construit des machines avec des performances de niveau humain. Dans les deux cas, les programmeurs ont des objectifs spécifiques en tête qui mènent plus ou moins directement à la technologie commerciale.

La valeur réelle de la technologie d'argumentation dans son ensemble ne sera pas livrée dans la salle des débats, mais dans des applications dans lesquelles les systèmes d'IA peuvent contribuer aux équipes de prise de décision humaines. Que ce soit dans la salle des incidents de la police, le bunker d'analyse du renseignement ou la salle de classe, ce ne peut être qu'une bonne chose d'augmenter la robustesse de la prise de décision fondée sur des preuves en introduisant des systèmes d'IA qui peuvent contribuer à la conversation. Ils pourront ajouter de nouvelles informations ou critiquer le raisonnement humain.

Project Debater est un pas en avant précieux vers cet objectif, et l'objectif plus large de construire une IA qui peut vraiment nous comprendre et nous répondre. Mais nous ne sommes certainement pas sur le point de voir des systèmes d'IA plus débattus que leurs homologues humains. La technologie d'IA d'aujourd'hui est aussi éloignée de ces scénarios que les expériences des Romains avec la puissance de la vapeur l'étaient de la révolution industrielle.

Cet article a été initialement publié sur The Conversation. Lire l'article original.