Un chercheur vient de terminer la rédaction d’un article scientifique. Elle sait que son travail pourrait bénéficier d’une autre perspective. A-t-elle oublié quelque chose ? Ou peut-être y a-t-il une application de ses recherches à laquelle elle n’avait pas pensé. Une deuxième paire d'yeux serait formidable, mais même le collaborateur le plus sympathique ne pourra peut-être pas prendre le temps de lire toutes les publications de base nécessaires pour rattraper son retard.
Kevin Yager, chef du groupe sur les nanomatériaux électroniques au Center for Functional Nanomaterials (CFN), un bureau des utilisateurs scientifiques du Département américain de l'énergie (DOE) au Brookhaven National Laboratory du DOE, a imaginé comment les progrès récents en matière d'intelligence artificielle (IA) et l’apprentissage automatique (ML) pourrait faciliter le brainstorming et l’idéation scientifiques. Pour ce faire, il a développé un chatbot possédant des connaissances dans les types de sciences dans lesquels il est engagé.
Les progrès rapides de l’IA et du ML ont cédé la place à des programmes capables de générer du texte créatif et du code logiciel utile. Ces chatbots à usage général ont récemment captivé l’imagination du public. Les chatbots existants, basés sur des modèles linguistiques vastes et diversifiés, manquent de connaissances détaillées sur les sous-domaines scientifiques.
En exploitant une méthode de récupération de documents, le robot de Yager possède des connaissances dans les domaines de la science des nanomatériaux que les autres robots ne possèdent pas. Les détails de ce projet et la manière dont d'autres scientifiques peuvent exploiter ce collègue de l'IA pour leurs propres travaux ont récemment été publiés dans Digital Discovery. .
« CFN étudie depuis longtemps de nouvelles façons d'exploiter l'IA/ML pour accélérer la découverte de nanomatériaux. Actuellement, il nous aide à identifier, cataloguer et choisir rapidement des échantillons, à automatiser les expériences, à contrôler les équipements et à découvrir de nouveaux matériaux. Esther Tsai, un scientifique du groupe des nanomatériaux électroniques du CFN, développe un compagnon d'IA pour aider à accélérer les expériences de recherche sur les matériaux à la National Synchrotron Light Source II (NSLS-II)." NSLS-II est une autre installation utilisateur du DOE Office of Science au Brookhaven Lab.
Au CFN, de nombreux travaux ont été réalisés sur l'IA/ML qui peuvent aider à mener des expériences grâce à l'utilisation de l'automatisation, des contrôles, de la robotique et de l'analyse, mais disposer d'un programme adapté aux textes scientifiques était quelque chose que les chercheurs n'avaient pas exploré. aussi profondément. Être capable de documenter, comprendre et transmettre rapidement des informations sur une expérience peut aider de plusieurs manières :depuis l'élimination des barrières linguistiques jusqu'au gain de temps en résumant des tâches plus importantes.
Surveiller votre langue
Pour créer un chatbot spécialisé, le programme nécessitait un texte spécifique au domaine, un langage tiré des domaines sur lesquels le bot est censé se concentrer. Dans ce cas, le texte est une publication scientifique. Un texte spécifique à un domaine aide le modèle d'IA à comprendre la nouvelle terminologie et les nouvelles définitions et l'introduit aux concepts scientifiques de pointe. Plus important encore, cet ensemble de documents permet au modèle d'IA de fonder son raisonnement sur des faits fiables.
Pour imiter le langage humain naturel, les modèles d'IA sont formés sur un texte existant, ce qui leur permet d'apprendre la structure du langage, de mémoriser divers faits et de développer un type de raisonnement primitif. Plutôt que de recycler laborieusement le modèle d’IA sur des textes nanoscientifiques, Yager lui a donné la possibilité de rechercher des informations pertinentes dans un ensemble de publications organisées. Lui fournir une bibliothèque de données pertinentes ne représentait que la moitié de la bataille. Pour utiliser ce texte avec précision et efficacité, le robot aurait besoin d'un moyen de déchiffrer le contexte correct.
"Un défi commun aux modèles de langage est que parfois ils" hallucinent "des choses qui semblent plausibles mais fausses", a expliqué Yager. "Cela a été un problème central à résoudre pour un chatbot utilisé dans la recherche, par opposition à celui qui fait quelque chose comme écrire de la poésie. Nous ne voulons pas qu'il fabrique des faits ou des citations. Il fallait résoudre ce problème. La solution à ce problème était quelque chose que nous "l'intégration", une façon de catégoriser et de relier rapidement les informations en coulisses."
L'intégration est un processus qui transforme des mots et des phrases en valeurs numériques. Le « vecteur d'intégration » résultant quantifie la signification du texte. Lorsqu'un utilisateur pose une question au chatbot, celle-ci est également envoyée au modèle d'intégration ML pour calculer sa valeur vectorielle. Ce vecteur est utilisé pour effectuer une recherche dans une base de données précalculée de morceaux de texte provenant d'articles scientifiques qui ont été intégrés de manière similaire. Le robot utilise ensuite les extraits de texte qu'il trouve et qui sont sémantiquement liés à la question pour obtenir une compréhension plus complète du contexte.
La requête de l'utilisateur et les extraits de texte sont combinés dans une « invite » qui est envoyée à un grand modèle de langage, un programme étendu qui crée un texte calqué sur le langage humain naturel, qui génère la réponse finale. L'intégration garantit que le texte extrait est pertinent dans le contexte de la question de l'utilisateur. En fournissant des morceaux de texte provenant du corps de documents fiables, le chatbot génère des réponses factuelles et fondées.
"Le programme doit ressembler à un bibliothécaire de référence", a déclaré Yager. "Il doit s'appuyer fortement sur les documents pour fournir des réponses fiables. Il doit être capable d'interpréter avec précision ce que les gens demandent et d'être capable de reconstituer efficacement le contexte de ces questions pour récupérer les informations les plus pertinentes. Même si les réponses peuvent ne pas être encore parfait, il est déjà capable de répondre à des questions difficiles et de déclencher des réflexions intéressantes tout en planifiant de nouveaux projets et recherches."
Des robots responsabilisent les humains
CFN développe des systèmes d'IA/ML en tant qu'outils qui peuvent permettre aux chercheurs humains de travailler sur des problèmes plus difficiles et plus intéressants et de tirer le meilleur parti de leur temps limité pendant que les ordinateurs automatisent les tâches répétitives en arrière-plan. Il existe encore de nombreuses inconnues concernant cette nouvelle façon de travailler, mais ces questions marquent le début d'importantes discussions que les scientifiques mènent actuellement pour garantir que l'utilisation de l'IA/ML est sûre et éthique.
"Il existe un certain nombre de tâches qu'un chatbot spécifique à un domaine comme celui-ci pourrait éliminer de la charge de travail d'un scientifique. Classer et organiser des documents, résumer des publications, souligner des informations pertinentes et se mettre à jour dans un nouveau domaine d'actualité ne sont que quelques-unes des tâches potentielles. applications", a fait remarquer Yager. "Mais je suis impatient de voir où tout cela nous mènera. Nous n'aurions jamais pu imaginer où nous en sommes aujourd'hui il y a trois ans, et j'ai hâte de voir où nous en serons dans trois ans."
Pour les chercheurs souhaitant essayer ce logiciel par eux-mêmes, le code source du chatbot de CFN et des outils associés peut être trouvé dans ce référentiel GitHub.
Plus d'informations : Kevin G. Yager, Chatbots spécifiques à un domaine pour la science utilisant des intégrations, Digital Discovery (2023). DOI :10.1039/D3DD00112A
Fourni par le Laboratoire national de Brookhaven