• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Physique
    Succès par tromperie

    Crédit :domaine public

    Des physiciens théoriciens de l'ETH Zurich ont délibérément induit en erreur les machines intelligentes, et ainsi affiner le processus d'apprentissage automatique. Ils ont créé une nouvelle méthode qui permet aux ordinateurs de catégoriser les données, même lorsque les humains n'ont aucune idée de ce à quoi cette catégorisation pourrait ressembler.

    Lorsque les ordinateurs identifient indépendamment les plans d'eau et leurs contours sur les images satellites, ou battre les meilleurs joueurs professionnels du monde au jeu de société Go, puis les algorithmes adaptatifs fonctionnent en arrière-plan. Les programmeurs fournissent à ces algorithmes des exemples connus en phase d'apprentissage :images de plans d'eau et de terre, ou des séquences de mouvements de Go qui ont mené au succès ou à l'échec des tournois. De la même manière que nos cellules nerveuses cérébrales produisent de nouveaux réseaux au cours des processus d'apprentissage, les algorithmes spéciaux s'adaptent dans la phase d'apprentissage en fonction des exemples qui leur sont présentés. Cela continue jusqu'à ce qu'ils soient capables de différencier les plans d'eau de la terre sur des photos inconnues, ou des séquences réussies de mouvements de celles qui échouent.

    Jusqu'à maintenant, ces réseaux de neurones artificiels ont été utilisés en machine learning avec un critère de décision connu :on sait ce qu'est un plan d'eau et quelles séquences de coups ont réussi dans les tournois de Go.

    Séparer le blé de l'ivraie

    Maintenant, un groupe de scientifiques travaillant sous Sebastian Huber, Professeur de théorie de la matière condensée et d'optique quantique à l'ETH Zurich, ont élargi les applications de ces réseaux de neurones en développant une méthode qui permet non seulement la catégorisation de toutes les données, mais reconnaît également si les ensembles de données complexes contiennent des catégories.

    Des questions de ce genre se posent en science :par exemple, la méthode pourrait être utile pour l'analyse de mesures provenant d'accélérateurs de particules ou d'observations astronomiques. Les physiciens pourraient ainsi filtrer les mesures les plus prometteuses de leurs quantités souvent ingérables de données de mesure. Les pharmacologues pourraient extraire des molécules ayant une certaine probabilité d'avoir un effet pharmaceutique ou un effet secondaire spécifique à partir de grandes bases de données moléculaires. Et les scientifiques des données pourraient trier d'énormes masses d'ondulations de données désordonnées et obtenir des informations utilisables (exploration de données).

    Rechercher une limite

    Les chercheurs de l'ETH ont appliqué leur méthode à un phénomène de physique théorique faisant l'objet de recherches intensives :un système à plusieurs corps de dipôles magnétiques en interaction qui n'atteint jamais un état d'équilibre, même à long terme. De tels systèmes ont été décrits récemment, mais on ne sait pas encore en détail quelles propriétés physiques quantiques empêchent un système à plusieurs corps d'entrer dans un état d'équilibre. En particulier, on ne sait pas exactement où se situe la frontière entre les systèmes qui atteignent l'équilibre et ceux qui n'y parviennent pas.

    Afin de localiser cette limite, les scientifiques ont développé le principe "act as if":prendre des données de systèmes quantiques, ils ont établi une limite arbitraire basée sur un paramètre et l'ont utilisé pour diviser les données en deux groupes. Ils ont ensuite formé un réseau de neurones artificiels en prétendant qu'un groupe a atteint un état d'équilibre alors que l'autre ne l'a pas fait. Ainsi, les chercheurs ont agi comme s'ils savaient où se trouvait la frontière.

    Les scientifiques ont confondu le système

    Ils ont formé le réseau d'innombrables fois dans l'ensemble, avec une limite différente à chaque fois, et testé la capacité du réseau à trier les données après chaque session. Le résultat fut que, dans de nombreux cas, le réseau a eu du mal à classer les données comme l'avaient fait les scientifiques. Mais dans certains cas, la division en deux groupes était très précise.

    Les chercheurs ont pu montrer que cette performance de tri dépend de l'emplacement de la frontière. Evert van Nieuwenburg, un doctorant dans le groupe Huber, explique ceci comme suit :"En choisissant de s'entraîner avec une limite éloignée de la limite réelle (que je ne connais pas), Je suis capable d'induire le réseau en erreur. En fin de compte, nous formons le réseau de manière incorrecte - et les réseaux mal formés sont très mauvais pour classer les données." Cependant, si par hasard une frontière est choisie proche de la frontière réelle, un algorithme très efficace est produit. En déterminant les performances de l'algorithme, les chercheurs ont pu tracer la frontière entre les systèmes quantiques qui atteignent l'équilibre et ceux qui n'y parviennent pas :la frontière se situe là où les performances de tri du réseau sont les plus élevées.

    Les chercheurs ont également démontré les capacités de leur nouvelle méthode en utilisant deux autres questions de physique théorique :les transitions de phase topologiques dans les solides unidimensionnels et le modèle d'Ising, qui décrit le magnétisme à l'intérieur des solides.

    Catégorisation sans connaissance préalable

    La nouvelle méthode peut également être illustrée sous une forme simplifiée avec une expérience de pensée, où l'on veut classer le rouge, rougeâtre, boules bleuâtres et bleues en deux groupes. Nous supposons que nous n'avons aucune idée de ce à quoi une telle classification pourrait raisonnablement ressembler.

    Si un réseau de neurones est entraîné en lui disant que la ligne de démarcation se situe quelque part dans la région rouge, alors cela va embrouiller le réseau. "Vous essayez d'enseigner au réseau que les boules bleues et rougeâtres sont identiques et lui demandez de faire la différence entre les boules rouges et rouges, ce qu'il n'est tout simplement pas capable de faire, " dit Huber.

    D'autre part, si vous placez la frontière dans le spectre de couleur violette, le réseau apprend une différence réelle et trie les balles en groupes rouges et bleus. Cependant, on n'a pas besoin de savoir à l'avance que la ligne de démarcation doit être dans la région violette. En comparant les performances de tri à une variété de limites choisies, cette frontière peut être trouvée sans connaissance préalable.

    © Science https://fr.scienceaq.com