• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Comment les machines nous apprennent à être plus innovants

    Dans l'environnement concurrentiel d'aujourd'hui, l'innovation est indispensable, Mais ce n'est pas assez. Crédit :Maxpixel, CC PAR

    La technologie ne peut toujours pas simuler l'intelligence humaine pour résoudre des problèmes complexes, dans un environnement variable et avec des informations partielles. Mais ça se rapproche. Un exemple est le cas des véhicules autonomes, capable de prendre des décisions optimales en temps réel, grâce à des algorithmes complexes qui prennent en compte plusieurs données.

    Un autre exemple est AlphaZero, l'algorithme développé par DeepMind, la division intelligence artificielle de Google, au sujet duquel Science a récemment publié un article. AlphaZero est capable de gagner dans les jeux de société les plus complexes pour l'esprit humain :échecs, shogi (échecs japonais) et go (jeu de société traditionnel chinois).

    L'avancée la plus importante d'AlphaZero réside dans le fait qu'il est basé sur un algorithme d'auto-apprentissage à partir de zéro (d'où son nom). En effet, juste connaître les règles du jeu, il est capable de commencer à jouer et d'apprendre seul, atteindre des niveaux élevés de connaissances capables de vaincre les meilleures machines (et, bien sûr, tout être humain) en quelques heures d'auto-apprentissage. Il a vaincu les meilleurs programmes de jeux tels que Stockfish (échecs), Elmo (shogi) ou AlphaGo (aller). Contrairement à AlphaZero, ces autres programmes fondent leurs décisions sur les connaissances préalablement acquises par les humains à travers des milliers d'heures de jeu et d'analyse.

    Dans le cas d'AlphaZero, la logique de la machine est différente de celle de l'humain, ce qui rend ses stratégies de jeu parfois surprenantes. Certains d'entre eux auraient pu être considérés comme risqués voire stupides, comme placer une pièce au centre de l'échiquier dans une position de vulnérabilité (supposée) ou sacrifier des pièces qui sont généralement considérées comme indispensables – mais qui mènent finalement à la victoire. L'une des conclusions est que l'esprit humain peut être un fardeau pour décider de manière rationnelle et efficace.

    La façon dont AlphaZero apprend et gagne nous fournit quelques indices sur la façon dont de nouvelles idées perturbatrices peuvent changer les contextes organisationnels et les marchés stables.

    De zéro, sans idées préconçues

    Dans de nombreuses industries qui ont été radicalement transformées, les acteurs clés du changement de paradigme ne sont souvent pas les principaux concurrents présents sur le marché, mais des individus, collectivités ou entreprises qui, d'un côté, bien connaître les bases techniques, et d'autre part, sont des acteurs de la périphérie, ce qui leur donne la liberté de créer et l'audace de proposer quelque chose de nouveau.

    Comparaison entre AlphaZero et d'autres programmes. Crédit :Sciences

    Par exemple, Steve Jobs, Steve Wozniak et Bill Gates ont développé l'industrie du PC dans l'ombre des grandes sociétés informatiques du moment, de la même manière que Netflix défie actuellement l'industrie cinématographique traditionnelle, ou Uber change le concept traditionnel du taxi. Comme dans le cas d'AlphaZero, il est important de ne pas s'appuyer sur les succès passés, mais pour appliquer le principe de "destruction créatrice" de Joseph Schumpeter selon lequel les révolutions ont lieu au sein des systèmes, en détruisant les normes établies pour les remplacer par de nouvelles.

    A la recherche de l'efficacité dans l'innovation

    Le succès d'AlphaZero ne repose pas sur une capacité de calcul supérieure aux autres machines, mais sur le fait qu'il prend des décisions de manière beaucoup plus sélective et efficace. Au lieu d'analyser toutes les chaînes possibles de différentes positions possibles, il ne considère que les mouvements les plus prometteurs. Dans l'environnement concurrentiel actuel, l'innovation est essentielle, Mais ce n'est pas assez. Il faut aussi être efficace tout en innovant, développer des produits innovants avant les concurrents, puisque tout avantage concurrentiel n'est que temporaire :il n'existe que pendant le temps nécessaire aux concurrents pour atteindre le même niveau d'innovation.

    AlphaZero peut prendre des décisions incohérentes selon le paradigme actuel (human learning), mais finalement sa stratégie mène à la victoire. De la même manière, dans le monde de l'entreprise, les décisions apparemment les plus folles se révèlent parfois les plus pertinentes. Par exemple, Andy Grove, PDG d'Intel, au milieu des années 80, a fait comprendre à ses collègues et investisseurs que la meilleure option était d'arrêter de vendre des mémoires PC et de miser plutôt sur le développement de microprocesseurs (et il ne s'était pas trompé).

    Focus sur l'innovation, pas le produit

    Bien qu'AlphaZero ait un objectif clair, pour gagner le jeu, il n'essaie pas de reproduire constamment les succès antérieurs. Sa stratégie de gain repose sur l'application systématique d'une méthode d'apprentissage. De la même manière, l'innovation dans les organisations se concentre souvent sur l'amélioration du produit en fonction des processus existants. Peu d'entreprises envisagent d'innover dans les processus organisationnels et, en particulier, dans les processus d'innovation. Par exemple, les routines créatives introduites chez Pixar ou Google permettent le développement de nouveaux produits qui n'auraient pas été possibles avec les méthodes traditionnelles.

    Compte tenu du succès incontestable d'AlphaZero dans les jeux de société, on pourrait interpréter à tort qu'une machine sera bientôt capable de prendre des décisions comme un être humain. Le processus de décision AlphaZero est basé sur des règles du jeu claires et stables. En changeant, environnements mal définis ou incertains, il faudrait un temps considérable pour s'adapter. Cependant, nous pouvons analyser ses processus décisionnels pour mieux comprendre les nôtres. La machine n'apprend plus des humains, c'est apprendre seul. Maintenant, il est temps que les humains apprennent de la machine.

    Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lire l'article original.




    © Science https://fr.scienceaq.com