• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Titres avec trait d'union pour l'exploration de données :Améliorer la reconnaissance des entités nommées

    Crédit :CC0 Domaine public

    L'exploration de données et l'extraction de connaissances à partir de sources disparates sont des mégadonnées, grosse affaire. Mais, Comment le logiciel de recherche gère-t-il les entités mentionnées lorsque seule une partie de leur nom est utilisée ou qu'un nom est coupé alors qu'il ne l'est normalement pas ? Recherche publiée dans le Journal international des systèmes d'information et de base de données intelligents révèle les détails d'une nouvelle approche pour améliorer la reconnaissance et la désambiguïsation des entités nommées dans les gros titres de l'actualité.

    Jayendra Barua et Rajdeep Niyogi du Département d'informatique et d'ingénierie, à l'Institut indien de technologie, à Roorkee, Uttarakhand, Inde, expliquent que leur approche d'une telle analyse des gros titres de l'actualité s'appuie sur un algorithme entraîné qui a appris à supprimer les traits d'union et à compléter les noms incomplets pour lever l'ambiguïté.

    L'évaluation par l'équipe de leur nouvelle approche montre qu'elle fonctionne avec une précision d'environ 10 % supérieure à celle des systèmes conventionnels et qu'elle pourrait ainsi améliorer la récupération automatisée des informations associées à des entreprises particulières, organisations, événements, personnalités publiques, et d'autres entités d'intérêt pour ceux qui exploitent les données. Le système fonctionne bien avec les fils d'actualité, tels que le type de fil d'actualité RSS généré par des sites Web régulièrement mis à jour. Les titres de ces sources peuvent généralement être plus longs que les titres de journaux conventionnels mais sont néanmoins succincts, généralement dix mots ou moins. Chaque mot peut alors être important dans un contexte d'exploration de données et la désambiguïsation est donc essentielle.


    © Science https://fr.scienceaq.com