• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Autres
    L'apprentissage automatique améliore les recherches dans la plus grande base de données de littérature biomédicale au monde

    Résultats triés par pertinence, au lieu de la date, offrir une expérience améliorée aux utilisateurs de PubMed, la plus grande base de données de littérature biomédicale au monde, selon une étude publiée le 28 août dans la revue en libre accès PLOS Biologie par Zhiyong Lu et ses collègues de la National Library of Medicine (NLM)/National Center for Biotechnology Information (NCBI), qui développe et maintient PubMed.

    PubMed contient plus de 28 millions de résumés d'articles de la littérature biomédicale, avec une moyenne de deux autres ajoutés chaque minute. C'est une ressource indispensable, portée mondiale, consultés par des millions d'utilisateurs chaque jour. Depuis sa création, les résultats de la recherche n'ont été renvoyés que dans l'ordre chronologique inverse, Le plus récent d'abord, un système de classement qui mettait l'accent sur la récence plutôt que sur la pertinence par rapport à la requête de recherche. En 2013, un système de classement par pertinence a été introduit, mais elle dépendait de facteurs de pondération artificiels et nécessitait un ajustement manuel continu.

    En juin 2017, Le personnel de NLM/NCBI a introduit un algorithme d'apprentissage automatique qui s'appuie sur des dizaines de signaux de pertinence, y compris les réponses des utilisateurs, en particulier, la fréquence des clics sur les articles renvoyés pour une recherche donnée, afin d'améliorer le classement par pertinence. Ce système de classement, appelé Meilleur match, est proposé comme alternative à l'ordre chronologique. L'équipe a constaté que le taux de clics augmentait de 20 % sur les résultats renvoyés par Best Match par rapport aux mêmes résultats présentés chronologiquement. L'utilisation globale du tri par pertinence est passée de 7,5 % de toutes les recherches avant l'introduction de la meilleure correspondance à 12 % en avril 2018. Étant donné que les systèmes d'apprentissage automatique dépendent des entrées des utilisateurs pour s'améliorer, l'augmentation de l'utilisation devrait permettre au système de "s'auto-apprendre" à devenir plus précieux pour ses utilisateurs au fil du temps.

    "Globalement, le nouvel algorithme Best-Match montre une amélioration significative dans la recherche d'informations pertinentes par rapport à l'ordre temporel par défaut dans PubMed, ", ont déclaré les auteurs. "Nous encourageons les utilisateurs de PubMed à essayer cette nouvelle recherche de pertinence et à fournir des commentaires pour nous aider à continuer à améliorer la méthode de classement."


    © Science https://fr.scienceaq.com