• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • IA plus intelligente :apprentissage automatique sans données négatives

    Schéma montrant des données positives (pommes) et un manque de données négatives (bananes), avec une illustration de la confiance des données Apple. Crédit :RIKEN

    Une équipe de recherche du RIKEN Center for Advanced Intelligence Project (AIP) a développé avec succès une nouvelle méthode d'apprentissage automatique qui permet à une IA de faire des classifications sans ce que l'on appelle « données négatives, " une conclusion qui pourrait conduire à une application plus large à une variété de tâches de classification.

    Classer les choses est essentiel pour notre vie quotidienne. Par exemple, nous devons détecter les spams, fausses nouvelles politiques, ainsi que des choses plus banales telles que des objets ou des visages. Lors de l'utilisation de l'IA, de telles tâches sont basées sur la « technologie de classification » en apprentissage automatique :faire apprendre à l'ordinateur en utilisant la frontière séparant les données positives et négatives. Par exemple, les données « positives » seraient des photos comprenant un visage heureux, et des photos de données « négatives » qui incluent un visage triste. Une fois qu'une limite de classification est apprise, l'ordinateur peut déterminer si une certaine donnée est positive ou négative. La difficulté avec cette technologie est qu'elle nécessite à la fois des données positives et négatives pour le processus d'apprentissage, et les données négatives ne sont pas disponibles dans de nombreux cas (par exemple, il est difficile de trouver des photos avec l'étiquette, "cette photo comprend un visage triste, " puisque la plupart des gens sourient devant une caméra.)

    En termes de programmes réels, lorsqu'un détaillant essaie de prédire qui fera un achat, il peut facilement trouver des données sur les clients qui ont acheté chez eux (données positives), mais il est fondamentalement impossible d'obtenir des données sur les clients qui n'ont pas acheté chez eux (données négatives), puisqu'ils n'ont pas accès aux données de leurs concurrents. Un autre exemple est une tâche courante pour les développeurs d'applications :ils doivent prédire quels utilisateurs continueront à utiliser l'application (positif) ou s'arrêteront (négatif). Cependant, lorsqu'un utilisateur se désinscrit, les développeurs perdent les données de l'utilisateur car ils doivent supprimer complètement les données concernant cet utilisateur conformément à la politique de confidentialité pour protéger les informations personnelles.

    Selon l'auteur principal Takashi Ishida de RIKEN AIP, "Les méthodes de classification précédentes ne pouvaient pas faire face à la situation où les données négatives n'étaient pas disponibles, mais nous avons permis aux ordinateurs d'apprendre avec uniquement des données positives, tant que nous avons un score de confiance pour nos données positives, construit à partir d'informations telles que l'intention d'achat ou le taux d'activité des utilisateurs de l'application. Grâce à notre nouvelle méthode, nous ne pouvons laisser les ordinateurs apprendre un classificateur qu'à partir de données positives dotées de confiance."

    Ishida a proposé, avec le chercheur Gang Niu de son groupe et le chef d'équipe Masashi Sugiyama, qu'ils laissent les ordinateurs bien apprendre en ajoutant le score de confiance, qui correspond mathématiquement à la probabilité que les données appartiennent ou non à une classe positive. Ils ont réussi à développer une méthode qui permet aux ordinateurs d'apprendre une limite de classification uniquement à partir de données positives et d'informations sur sa confiance (fiabilité positive) par rapport aux problèmes de classification de l'apprentissage automatique qui divisent les données positivement et négativement.

    Pour voir si le système fonctionnait bien, ils l'ont utilisé sur un ensemble de photos contenant diverses étiquettes d'articles de mode. Par exemple, ils ont choisi "T-shirt, " comme la classe positive et un autre élément, par exemple., "sandale", comme classe négative. Ensuite, ils ont attaché un score de confiance aux photos de "T-shirt". Ils ont constaté que sans accéder aux données négatives (par exemple, photos "sandales") dans certains cas, leur méthode était aussi bonne qu'une méthode qui implique l'utilisation de données positives et négatives.

    Selon Ishida, "Cette découverte pourrait élargir la gamme d'applications où la technologie de classification peut être utilisée. Même dans les domaines où l'apprentissage automatique a été activement utilisé, notre technologie de classification pourrait être utilisée dans de nouvelles situations où seules des données positives peuvent être recueillies en raison de la réglementation des données ou de contraintes commerciales. Dans le futur proche, nous espérons mettre notre technologie à profit dans divers domaines de recherche, comme le traitement du langage naturel, vision par ordinateur, robotique, et bioinformatique."


    © Science https://fr.scienceaq.com