Crédit :CC0 Domaine public
Une nouvelle étude du MIT trouve « des graphiques de connaissances sur la santé, " qui montrent des relations entre les symptômes et les maladies et sont destinés à aider au diagnostic clinique, peut être insuffisant pour certaines conditions et populations de patients. Les résultats suggèrent également des moyens d'améliorer leurs performances.
Les graphiques de connaissances sur la santé ont généralement été compilés manuellement par des cliniciens experts, mais cela peut être un processus laborieux. Récemment, les chercheurs ont expérimenté la génération automatique de ces graphiques de connaissances à partir des données des patients. L'équipe du MIT a étudié dans quelle mesure ces graphiques résistent à différentes maladies et populations de patients.
Dans un article présenté au Pacific Symposium on Biocomputing 2020, les chercheurs ont évalué des graphiques de connaissances sur la santé générés automatiquement sur la base d'ensembles de données réels comprenant plus de 270, 000 patients avec près de 200 maladies et plus de 770 symptômes.
L'équipe a analysé comment divers modèles utilisaient les données des dossiers de santé électroniques (DSE), contenant les antécédents médicaux et de traitement des patients, pour « apprendre » automatiquement les modèles de corrélations maladie-symptôme. Ils ont constaté que les modèles fonctionnaient particulièrement mal pour les maladies qui ont des pourcentages élevés de patients très âgés ou jeunes, ou des pourcentages élevés de patients masculins ou féminins, mais que choisir les bonnes données pour le bon modèle, et apporter d'autres modifications, peut améliorer les performances.
L'idée est de fournir des conseils aux chercheurs sur la relation entre la taille de l'ensemble de données, Modèle Spécification, et la performance lors de l'utilisation des dossiers de santé électroniques pour créer des graphiques de connaissances sur la santé. Cela pourrait conduire à de meilleurs outils pour aider les médecins et les patients à prendre des décisions médicales ou à rechercher de nouvelles relations entre les maladies et les symptômes.
« Au cours des 10 dernières années, L'utilisation du DSE a explosé dans les hôpitaux, il y a donc une énorme quantité de données que nous espérons exploiter pour apprendre ces graphiques des relations maladie-symptôme, " dit le premier auteur Irene Y. Chen, un étudiant diplômé du Département de génie électrique et informatique (EECS). « Il est essentiel que nous examinions de près ces graphiques, afin qu'ils puissent être utilisés comme les premières étapes d'un outil de diagnostic."
Rejoindre Chen sur le papier sont Monica Agrawal, un étudiant diplômé du Laboratoire d'informatique et d'intelligence artificielle (CSAIL) du MIT ; Steven Horng du Centre médical Beth Israel Deaconess (BIDMC); et le professeur EECS David Sontag, qui est membre du CSAIL et de l'Institute for Medical Engineering and Science, et chef du groupe d'apprentissage machine clinique.
Patients et maladies
Dans les graphiques de connaissances en santé, il y a des centaines de nœuds, chacun représentant une maladie et un symptôme différents. Les bords (lignes) relient les ganglions de la maladie, tels que « diabète, " avec des nœuds symptomatiques corrélés, comme « soif excessive ». Google a lancé sa propre version en 2015, qui a été organisée manuellement par plusieurs cliniciens pendant des centaines d'heures et est considérée comme l'étalon-or. Lorsque vous recherchez une maladie sur Google maintenant, le système affiche les symptômes associés.
Dans un article de 2017 Nature Scientific Reports, Sontag, Horn, et d'autres chercheurs ont exploité les données des mêmes 270, 00 patients dans leur étude actuelle - qui provenaient du service des urgences du BIDMC entre 2008 et 2013 - pour construire des graphiques de connaissances sur la santé. Ils ont utilisé trois structures de modèle pour générer les graphiques, appelée régression logistique, Bayes naïf, et bruyant OU. En utilisant les données fournies par Google, les chercheurs ont comparé leur graphique de connaissances sur la santé généré automatiquement avec le Google Health Knowledge Graph (GHKG). Le graphique des chercheurs a très bien fonctionné.
Dans leur nouveau travail, les chercheurs ont effectué une analyse d'erreur rigoureuse pour déterminer les patients et les maladies spécifiques pour lesquels les modèles fonctionnaient mal. En outre, ils ont expérimenté l'augmentation des modèles avec plus de données, d'au-delà de la salle d'urgence.
Dans un essai, ils ont divisé les données en sous-populations de maladies et de symptômes. Pour chaque modèle, ils ont examiné les liens entre les maladies et tous les symptômes possibles, et comparé cela avec le GHKG. Dans le journal, ils classent les résultats dans les 50 maladies les moins performantes et les 50 maladies les plus performantes. Des exemples de faibles performances sont le syndrome des ovaires polykystiques (qui affecte les femmes), asthme allergique (très rare), et le cancer de la prostate (qui touche principalement les hommes plus âgés). Les plus performants sont les maladies et affections les plus courantes, tels que l'arythmie cardiaque et la fasciite plantaire, qui est un gonflement des tissus le long des pieds.
Ils ont trouvé que le modèle OR bruyant était le plus robuste contre l'erreur dans l'ensemble pour presque toutes les maladies et tous les patients. Mais la précision a diminué parmi tous les modèles pour les patients présentant de nombreuses maladies et symptômes concomitants, ainsi que les patients qui sont très jeunes ou âgés de plus de 85 ans. La performance a également souffert pour les populations de patients avec des pourcentages très élevés ou faibles de tout sexe.
Essentiellement, les chercheurs émettent l'hypothèse, la mauvaise performance est causée par des patients et des maladies qui ont des performances prédictives aberrantes, ainsi que des facteurs de confusion potentiels non mesurés. Patients âgés, par exemple, ont tendance à entrer dans les hôpitaux avec plus de maladies et de symptômes connexes que les patients plus jeunes. Cela signifie qu'il est difficile pour les modèles de corréler des maladies spécifiques avec des symptômes spécifiques, dit Chen. "De la même manière, " Elle ajoute, "les jeunes patients n'ont pas beaucoup de maladies ou autant de symptômes, et s'ils ont une maladie ou un symptôme rare, il ne présente pas d'une manière normale que les modèles comprennent."
Fractionnement des données
Les chercheurs ont également collecté beaucoup plus de données sur les patients et créé trois ensembles de données distincts de granularité différente pour voir si cela pouvait améliorer les performances. Pour le 270, 000 visites utilisées dans l'analyse originale, les chercheurs ont extrait l'historique complet du DSE des 140, 804 patients uniques, remonter une décennie en arrière, avec environ 7,4 millions d'annotations au total provenant de diverses sources, comme les notes du médecin.
Les choix dans le processus de création de l'ensemble de données ont également eu un impact sur les performances du modèle. L'un des ensembles de données agrège chacun des 140, 400 histoires de patients comme un point de données chacune. Un autre jeu de données traite chacune des 7,4 millions d'annotations comme un point de données distinct. Un dernier crée des "épisodes" pour chaque patient, défini comme une série continue de visites sans interruption de plus de 30 jours, pour un total d'environ 1,4 million d'épisodes.
Intuitivement, un ensemble de données où l'historique complet du patient est agrégé en un seul point de données devrait conduire à une plus grande précision puisque l'ensemble de l'historique du patient est pris en compte. Contre-intuitivement, cependant, cela a également fait en sorte que le modèle naïf de Bayes fonctionne moins bien pour certaines maladies. "Vous assumez les informations plus intra-patient, le meilleur, avec des modèles d'apprentissage automatique. Mais ces modèles dépendent de la granularité des données que vous leur fournissez, " dit Chen. " Le type de modèle que vous utilisez pourrait être dépassé. "
Comme prévu, alimenter le modèle en informations démographiques peut également être efficace. Par exemple, les modèles peuvent utiliser ces informations pour exclure tous les patients de sexe masculin pour, dire, prédire le cancer du col de l'utérus. Et certaines maladies beaucoup plus courantes chez les patients âgés peuvent être éliminées chez les patients plus jeunes.
Mais, dans une autre surprise, les informations démographiques n'ont pas amélioré les performances du modèle le plus performant, la collecte de ces données peut donc être inutile. C'est important, Chen dit, car la compilation des données et des modèles d'entraînement sur les données peut être coûteuse et longue. Encore, selon le modèle, l'utilisation de scores de données peut ne pas réellement améliorer les performances.
Prochain, les chercheurs espèrent utiliser leurs découvertes pour construire un modèle robuste à déployer en milieu clinique. Actuellement, le graphique des connaissances sur la santé apprend les relations entre les maladies et les symptômes mais ne donne pas une prédiction directe de la maladie à partir des symptômes. « Nous espérons que tout modèle prédictif et tout graphique de connaissances médicales seront soumis à un test de résistance afin que les cliniciens et les chercheurs en apprentissage automatique puissent dire en toute confiance :« Nous croyons qu'il s'agit d'un outil de diagnostic utile, '", dit Chen.
Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.