Crédit :CC0 Domaine public
Aide à la prise de décision structurée :le projet de recherche "ArgumenText" dans le domaine du traitement des connaissances ubiquitaire a trouvé un moyen de filtrer les arguments concrets pour et contre sur n'importe quel sujet parmi le bruit d'Internet.
La recherche sur Internet du terme de recherche « Énergie nucléaire » sur Google génère environ 268 millions de résultats : Explications, définitions, textes de lobbying, articles de journaux, anecdotes, théories du complot. Comment quelqu'un peut-il, par exemple un investisseur, rechercher de véritables arguments pour et contre le nucléaire comme outil d'aide à la décision, trouver ce qu'ils cherchent ? Le projet "ArgumenText" dans le domaine du Fachgebiet Ubiquitous Knowledge Processing (UKP) du Département d'informatique de la TU Darmstadt vise à filtrer les arguments concrets à partir de masses de texte volumineuses et hétérogènes.
Récemment, une démonstration du système de recherche est apparue et a déjà fait ses preuves sur les salons. Par exemple, toute personne qui fait des recherches sur le sujet de « l'énergie nucléaire », après quelques secondes, voir un peu moins d'une centaine d'arguments pour et contre l'énergie nucléaire – à partir de divers sites Internet. Le meilleur CO
Dans ce but, les textes disponibles sur Internet sont examinés au moyen de réseaux de neurones, classés comme pertinents ou non pertinents pour le sujet de recherche, puis tapoté pour des arguments. « Non seulement les mots individuels sont recherchés, mais des structures grammaticales, les contextes et la sémantique sont examinés pour décider si une déclaration est un « argument » ou non et si elle est du côté du pour ou du contre, " explique le Dr Johannes Daxenberger, qui travaille dans l'équipe du professeur Iryna Gurevych en tant que l'un des deux chefs de projet chez ArgumenText.
Les algorithmes derrière ArgumenText sont en cours de développement par l'équipe sur le terrain elle-même, en s'appuyant sur des expériences initiales qui ont commencé en 2014 avec un corpus d'essais d'étudiants. "L'enjeu était de rendre un système formé sur un type de texte spécifique transférable à n'importe quel type de texte, " déclare le deuxième chef de projet, le Dr Christian Stab." Argumentation dans les textes scientifiques, par exemple, est complètement différent de celui des médias sociaux. » L'équipe a opérationnalisé divers modèles de théorie de l'argumentation et a appris aux systèmes informatiques à utiliser ces modèles. Pour optimiser les algorithmes, l'équipe employée à un réseau informatique puissant; un plus petit, un réseau informatique plus puissant, capable d'indexer efficacement les textes sur Internet, est désormais utilisé pour le fonctionnement continu.
Démonstrateur public
Le démonstrateur est stable et est récemment devenu accessible au public. Le projet entre ainsi dans la phase suivante, qui testera spécifiquement quelles applications sont particulièrement prometteuses pour la nouvelle technologie. Les principaux groupes cibles sont les décideurs du monde de l'entreprise qui doivent évaluer si l'utilisation d'une innovation en vaut la peine, et les journalistes qui doivent se frayer un chemin rapide et fiable au cœur d'un sujet dans le cadre d'une recherche, dit Daxenberger. "Nous pensons que le système pourrait être utilisé de manière rentable dans ces domaines."
A des fins de validation, les scientifiques participants préparent actuellement la méthode pour une utilisation avec des textes en allemand également. Maintenant, ArgumenText ne parle que l'anglais, fonctionne avec un corpus de texte de l'année 2016 et fonctionne mieux avec des requêtes techniques. Cela va bientôt changer. Il sera également possible de rechercher en temps réel dans le nombre toujours croissant de textes sur Internet.
Actuellement, l'algorithme trie les déclarations en fonction de la fiabilité avec laquelle elles peuvent servir d'arguments. Les scientifiques travaillent à l'agrégation des arguments envers les utilisateurs, les présenter par thèmes. « Ceci est évident du point de vue de l'application, mais certainement pas anodin d'un point de vue technique, " dit Stab. Argument mining, la reconnaissance d'arguments linguistiques au moyen de l'informatique, devient de plus en plus important et visible, disent Daxenberger et Stab, dans la recherche des Humanités Numériques. La TU a été active dans ce domaine très tôt. "Notre groupe de travail a bien et visiblement établi la TU dans le domaine de l'argument mining, " dit le professeur Iryna Gurevych, chef de l'UKP. Dans ce but, l'équipe interdisciplinaire travaille avec le Département des sciences sociales et historiques de la TU, ainsi qu'avec d'autres universités du réseau des universités Rhin-Main.