• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • La recherche en apprentissage automatique peut aider de nombreuses industries

    Crédit :CC0 Domaine public

    courriers indésirables, fraude bancaire, Diabète, travailleurs quittent leur emploi. Qu'est-ce que ces sujets ont en commun ? La réponse se trouve dans la recherche sur l'apprentissage automatique à l'Université de Binghamton.

    Dana Bani Hani, un doctorant en ingénierie industrielle et des systèmes, a passé ces dernières années à enseigner aux machines comment lire des ensembles de données dans n'importe quelle industrie. Le système qu'elle a codé, appelé Oracle de réseau de neurones à régression générale récursive (Oracle R-GRNN), prend des entrées de données et crée des sorties de prédiction.

    Les modèles de régression ne sont pas nouveaux dans la science des données et l'analyse, mais ce que Bani-Hani a créé va au-delà des bases. Un système typique utilise des algorithmes, appelés classificateurs, qui parcourent un ensemble de données de nombreuses variables différentes pour créer une prédiction. Les oracles sont créés pour exécuter plusieurs ensembles de ces classificateurs afin de voir quel algorithme crée la prédiction la plus précise.

    Par exemple, un classificateur peut examiner une myriade d'e-mails et prendre en compte certains usages des mots, nombre de mots et plusieurs autres variables pour déterminer si l'e-mail est un spam. Un oracle examine les différentes sorties du classificateur et détermine celui qui a prédit le plus précisément les e-mails de spam.

    Ce qui distingue l'Oracle R-GRNN des autres oracles, c'est sa capacité à prendre les sorties du classificateur et à les classer en fonction de leur précision. Sur la base du classement, les classificateurs reçoivent des poids et sont combinés pour produire une prédiction supérieure à n'importe quel classificateur seul.

    Considérez ce processus comme un orchestre. Chaque instrument a ses propres atouts, tout comme différents classificateurs, il est donc utile de les inclure tous. Le conducteur, comme l'Oracle R-GRNN, ordonne aux différents instruments de jouer fort ou plus doucement en fonction de la façon dont l'instrument produit le son final de la symphonie.

    À ce point, le système s'appellerait un réseau neuronal de régression générale (GRNN), qui a été créé auparavant à l'Université de Binghamton. Le véritable nœud du travail de Bani-Hani réside dans la première lettre, R, debout pour la récursivité.

    L'Oracle R-GRNN prend la sortie GRNN d'origine, et utilise tout ce système comme entrée pour une autre prédiction GRNN. Ceci est combiné avec le plus réussi des classificateurs originaux.

    Donc, retour à l'orchestre :La symphonie originale est enregistrée, puis rejoué plus tard. Cette fois, avec l'enregistrement, quelques instruments jouent à nouveau pour affiner davantage les sons importants de l'orchestre.

    « En raison de la façon dont [le GRNN] fonctionne, J'ai pu créer le modèle récursif, " dit Bani-Hani. " Le concept de récursivité n'est pas largement utilisé dans l'apprentissage automatique, alors j'ai décidé de mettre un oracle à l'intérieur d'un oracle."

    Mohamed Khasawneh, professeur et directeur de département en science des systèmes et génie industriel, supervisé les recherches de Bani-Hani. Il dit que des systèmes comme le GRNN et le R-GRNN sont sous-utilisés et sont vitaux dans les événements graves de la vie.

    "L'Oracle GRNN traditionnel a reçu une attention limitée dans la littérature car très peu de chercheurs ont publié des travaux sur l'algorithme, ", dit Khasawneh. "Mais de nombreux problèmes réels qui appliquent des modèles d'apprentissage automatique pour automatiser la classification d'observations inconnues nécessitent des prédictions précises. Des tâches telles que le diagnostic des maladies nécessitent une précision pour éviter des problèmes graves qui pourraient potentiellement conduire à des problèmes tels que des poursuites judiciaires ou même des décès. »

    Bani-Hani dit que l'Oracle R-GRNN produit des prédictions plus précises que n'importe quel classificateur seul, ainsi qu'un seul GRNN. L'Oracle R-GRNN a recueilli des milliers d'échantillons d'e-mails, programmé pour factoriser 57 variables, et a ensuite produit une prédiction de spam supérieure à tous les autres classificateurs testés.

    Bani-Hani a également utilisé le R-GRNN pour prédire la fraude aux demandes de carte de crédit, diagnostic de diabète et si un travailleur démissionnera en fonction de ses expériences passées en milieu de travail. Dans chaque cas, le R-GRNN est sorti comme le prédicteur le plus précis.

    Elle envisage d'axer son modèle sur des domaines spécifiques, comme les affaires ou la finance, ainsi que l'empaquetage de l'Oracle GRNN et de l'Oracle R-GRNN afin que les entreprises n'aient pas à créer l'intégralité du code à partir de zéro.

    Le parcours de Bani-Hani vers la recherche en apprentissage automatique a commencé près de 6, 000 miles de Binghamton en Jordanie. Après avoir obtenu son baccalauréat en génie architectural, elle a entendu parler de l'Université de Binghamton par le biais du corps professoral et des dirigeants universitaires de la Watson School, et des suggestions de soutien de son père. Elle a d'abord poursuivi une maîtrise en génie industriel, mais elle s'est vite découvert une nouvelle passion :l'exploration de données et l'apprentissage automatique.

    "Obtenir un doctorat est un de mes rêves depuis 15 ans, " dit Bani-Hani. " J'attribue principalement cela au fait d'avoir une famille avec des diplômes supérieurs. Je suis reconnaissant à mes professeurs ici à l'Université de Binghamton de m'avoir présenté les sujets qui composent ma recherche. »


    © Science https://fr.scienceaq.com