• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Une étude montre que les méthodes d'apprentissage automatique largement utilisées ne fonctionnent pas comme on le prétend

    L'IA servira à développer un système de contrôle de réseau qui non seulement détecte et réagit aux problèmes, mais peut également les prévoir et les éviter. Crédit :CC0 Domaine public

    Les modèles et algorithmes d'analyse de réseaux complexes sont largement utilisés dans la recherche et affectent la société dans son ensemble à travers leurs applications dans les réseaux sociaux en ligne, moteurs de recherche, et les systèmes de recommandation. Selon une nouvelle étude, cependant, une approche algorithmique largement utilisée pour modéliser ces réseaux est fondamentalement imparfaite, ne pas capturer les propriétés importantes des réseaux complexes du monde réel.

    "Ce n'est pas que ces techniques vous donnent des déchets absolus. Elles contiennent probablement des informations, mais pas autant d'informations que beaucoup de gens le croient, " dit C. " Sesh " Seshadhri, professeur agrégé d'informatique et d'ingénierie à la Baskin School of Engineering de l'UC Santa Cruz.

    Seshadhri est le premier auteur d'un article sur les nouvelles découvertes publié le 2 mars dans Actes de l'Académie nationale des sciences . L'étude a évalué des techniques connues sous le nom de « plongements de faible dimension, " qui sont couramment utilisés comme entrée dans les modèles d'apprentissage automatique. Il s'agit d'un domaine de recherche actif, avec de nouvelles méthodes d'intégration en cours de développement à un rythme rapide. Mais Seshadhri et ses coauteurs disent que toutes ces méthodes partagent les mêmes défauts.

    Pour expliquer pourquoi, Seshadhri a utilisé l'exemple d'un réseau social, un type familier de réseau complexe. De nombreuses entreprises appliquent l'apprentissage automatique aux données des réseaux sociaux pour générer des prédictions sur le comportement des gens, recommandations aux utilisateurs, etc. Les techniques d'intégration convertissent essentiellement la position d'une personne dans un réseau social en un ensemble de coordonnées pour un point dans un espace géométrique, produisant une liste de nombres pour chaque personne qui peut être branchée sur un algorithme.

    "C'est important parce que quelque chose d'abstrait comme la "position d'une personne dans un réseau social" peut être converti en une liste concrète de nombres. Une autre chose importante est que vous vouliez convertir cela en un espace de faible dimension, de sorte que la liste des nombres représentant chaque personne soit relativement petite, " expliqua Seshadhri.

    Une fois cette conversion effectuée, le système ignore le réseau social réel et fait des prédictions basées sur les relations entre les points dans l'espace. Par exemple, si de nombreuses personnes proches de vous dans cet espace achètent un produit particulier, le système peut prédire que vous êtes susceptible d'acheter le même produit.

    Seshadhri et ses coauteurs ont démontré mathématiquement que des aspects structurels importants des réseaux complexes sont perdus dans ce processus d'intégration. Ils ont également confirmé ce résultat en testant empiriquement diverses techniques d'intégration sur différents types de réseaux complexes.

    "Nous ne disons pas que certaines méthodes spécifiques échouent. Nous disons que toute méthode d'intégration qui vous donne une petite liste de nombres va fondamentalement échouer, parce qu'une géométrie de faible dimension n'est tout simplement pas assez expressive pour les réseaux sociaux et autres réseaux complexes, " a déclaré Seshadri.

    Une caractéristique cruciale des réseaux sociaux du monde réel est la densité des triangles, ou des relations entre trois personnes.

    "Où vous avez beaucoup de triangles, cela signifie qu'il y a beaucoup de structure communautaire dans cette partie d'un réseau social, " dit Seshadhri. " De plus, ces triangles sont encore plus significatifs lorsque vous regardez des personnes qui ont des réseaux sociaux limités. Dans un réseau social typique, certaines personnes ont des tonnes de connexions, mais la plupart des gens n'ont pas beaucoup de relations."

    Dans leur analyse des techniques d'enrobage, les chercheurs ont observé que de nombreux triangles sociaux représentant la structure communautaire sont perdus dans le processus d'intégration. "Toutes ces informations semblent disparaître, c'est donc presque comme si la chose même que vous vouliez trouver avait été perdue lorsque vous construisez ces représentations géométriques, " a déclaré Seshadri.

    Les plongements de faible dimension ne sont en aucun cas les seules méthodes utilisées pour générer des prédictions et des recommandations. Ils ne sont généralement que l'une des nombreuses entrées d'un modèle d'apprentissage automatique très vaste et complexe.

    "Ce modèle est une énorme boîte noire, et de nombreux résultats positifs rapportés indiquent que si vous incluez ces inclusions de faible dimension, vos performances augmentent, peut-être que vous obtenez une légère bosse. Mais si vous l'avez utilisé seul, il semble que tu en manquerais beaucoup, " a déclaré Seshadri.

    Il a également noté que les nouvelles méthodes d'intégration sont principalement comparées à d'autres méthodes d'intégration. Des travaux empiriques récents d'autres chercheurs, cependant, montre que différentes techniques peuvent donner de meilleurs résultats pour des tâches spécifiques.

    "Disons que vous voulez prédire qui est républicain et qui est démocrate. Il existe des techniques développées spécifiquement pour cette tâche qui fonctionnent mieux que les intégrations, " a-t-il dit. " L'affirmation est que ces techniques d'intégration fonctionnent pour de nombreuses tâches différentes, et c'est pourquoi beaucoup de gens les ont adoptés. Il est également très facile de les connecter à un système d'apprentissage automatique existant. Mais pour une tâche particulière, il s'avère qu'il y a toujours quelque chose de mieux que vous pouvez faire."

    Compte tenu de l'influence croissante de l'apprentissage automatique dans notre société, Seshadhri a déclaré qu'il est important de déterminer si les hypothèses sous-jacentes des modèles sont valides.

    "Nous avons toutes ces machines compliquées qui font des choses qui affectent considérablement nos vies. Notre message est simplement que nous devons être plus prudents dans l'évaluation de ces techniques, ", a-t-il déclaré. "Surtout à notre époque où l'apprentissage automatique devient de plus en plus compliqué, il est important d'avoir une certaine compréhension de ce qui peut et ne peut pas être fait."


    © Science https://fr.scienceaq.com