Des chercheurs du MIT ont développé un modèle d'apprentissage automatique qui regroupe les patients en sous-populations par état de santé afin de mieux prédire le risque de décès d'un patient pendant son séjour en soins intensifs. Cette technique surpasse les modèles de prédiction de mortalité « globaux » et révèle des disparités de performance de ces modèles parmi des sous-populations de patients spécifiques. Crédit : Institut de technologie du Massachusetts
Dans les unités de soins intensifs, où les patients arrivent avec un large éventail de problèmes de santé, le triage repose fortement sur le jugement clinique. Le personnel des soins intensifs effectue de nombreux tests physiologiques, tels que les analyses de sang et la vérification des signes vitaux, pour déterminer si les patients courent un risque immédiat de mourir s'ils ne sont pas traités de manière agressive.
Entrez :apprentissage automatique. De nombreux modèles ont été développés ces dernières années pour aider à prédire la mortalité des patients en soins intensifs, en fonction de divers facteurs de santé au cours de leur séjour. Ces modèles, cependant, présentent des inconvénients en termes de performances. Un type courant de modèle « global » est formé sur une seule grande population de patients. Ceux-ci pourraient bien fonctionner en moyenne, mais mal sur certaines sous-populations de patients. D'autre part, un autre type de modèle analyse différentes sous-populations, par exemple, ceux regroupés par des conditions similaires, âge des patients, ou les services hospitaliers, mais ont souvent des données limitées pour la formation et les tests.
Dans un article récemment présenté à la conférence Proceedings of Knowledge Discovery and Data Mining, Les chercheurs du MIT décrivent un modèle d'apprentissage automatique qui fonctionne comme le meilleur des deux mondes :il s'entraîne spécifiquement sur des sous-populations de patients, mais partage également des données sur toutes les sous-populations pour obtenir de meilleures prévisions. Ce faisant, le modèle peut mieux prédire le risque de mortalité d'un patient au cours de ses deux premiers jours en soins intensifs, par rapport aux modèles strictement globaux et autres.
Le modèle analyse d'abord les données physiologiques dans les dossiers de santé électroniques des patients en soins intensifs précédemment admis, certains qui étaient morts pendant leur séjour. Ce faisant, il apprend des prédicteurs élevés de mortalité, comme une fréquence cardiaque faible, hypertension artérielle, et divers résultats de tests de laboratoire :taux de glucose élevés et nombre de globules blancs, entre autres, au cours des premiers jours et répartit les patients en sous-populations en fonction de leur état de santé. Étant donné un nouveau patient, le modèle peut examiner les données physiologiques de ce patient au cours des 24 premières heures et, en utilisant ce qu'il a appris en analysant ces sous-populations de patients, mieux estimer la probabilité que le nouveau patient décède également dans les 48 heures suivantes.
De plus, les chercheurs ont découvert que l'évaluation (test et validation) du modèle par des sous-populations spécifiques met également en évidence les disparités de performance des modèles mondiaux dans la prédiction de la mortalité entre les sous-populations de patients. Il s'agit d'informations importantes pour développer des modèles qui peuvent fonctionner plus précisément avec des patients spécifiques.
« Les unités de soins intensifs ont une bande passante très élevée, avec beaucoup de patients, " dit le premier auteur Harini Suresh, un étudiant diplômé du Laboratoire d'Informatique et d'Intelligence Artificielle (CSAIL). "Il est important de déterminer bien à l'avance quels patients sont réellement à risque et ont le plus besoin d'une attention immédiate."
Les co-auteurs de l'article sont Jen Gong, étudiante diplômée du CSAIL, et John Guttag, le professeur Dugald C. Jackson en génie électrique.
Multitâche et sous-populations de patients
Une innovation clé du travail est que, pendant la formation, le modèle sépare les patients en sous-populations distinctes, qui saisit les aspects de l'état de santé général d'un patient et les risques de mortalité. Il le fait en calculant une combinaison de données physiologiques, décomposé à l'heure. Les données physiologiques comprennent, par exemple, taux de glucose, potassium, et de l'azote, ainsi que la fréquence cardiaque, pH sanguin, Saturation d'oxygène, et la fréquence respiratoire. L'augmentation de la pression artérielle et des taux de potassium, signe d'une insuffisance cardiaque, peut indiquer des problèmes de santé par rapport à d'autres sous-populations.
Prochain, le modèle utilise une méthode d'apprentissage multitâche pour créer des modèles prédictifs. Lorsque les patients sont divisés en sous-populations, des modèles réglés différemment sont attribués à chaque sous-population. Chaque modèle de variante peut alors faire des prédictions plus précises pour son groupe personnalisé de patients. Cette approche permet également au modèle de partager des données entre toutes les sous-populations lorsqu'il fait des prédictions. Lorsqu'on lui donne un nouveau patient, il fera correspondre les données physiologiques du patient à toutes les sous-populations, trouver le meilleur ajustement, et ensuite mieux estimer le risque de mortalité à partir de là.
« Nous utilisons toutes les données des patients et partageons les informations entre les populations lorsque cela est pertinent, " Suresh dit. " De cette façon, nous pouvons … ne pas souffrir de problèmes de pénurie de données, tout en tenant compte des différences entre les différentes sous-populations de patients."
« Les patients admis aux soins intensifs diffèrent souvent quant à la raison de leur présence et à leur état de santé. Pour cette raison, ils seront traités très différemment, " ajoute Gong. Les outils d'aide à la décision clinique " devraient tenir compte de l'hétérogénéité de ces populations de patients … et s'assurer qu'il y a suffisamment de données pour des prédictions précises ".
Un aperçu clé de cette méthode, Gong dit, provenait de l'utilisation d'une approche multitâche pour évaluer également les performances d'un modèle sur des sous-populations spécifiques. Les modèles globaux sont souvent évalués en performance globale, à travers des populations entières de patients. Mais les expériences des chercheurs ont montré que ces modèles sont en fait sous-performants sur les sous-populations. Le modèle global testé dans l'article a prédit la mortalité de manière assez précise dans l'ensemble, mais a perdu plusieurs points de pourcentage de précision lorsqu'il a été testé sur des sous-populations individuelles.
De telles disparités de performance sont difficiles à mesurer sans évaluer par sous-populations, Gong dit :"Nous voulons évaluer les performances de notre modèle, pas seulement sur toute une cohorte de patients, mais aussi lorsque nous le décomposons pour chaque cohorte avec des caractéristiques médicales différentes. Cela peut aider les chercheurs à mieux former et évaluer les modèles prédictifs. »
Obtenir des résultats
Les chercheurs ont testé leur modèle en utilisant les données de la base de données MIMIC Critical Care, qui contient des dizaines de données sur des populations de patients hétérogènes. Sur environ 32, 000 patients dans le jeu de données, plus de 2, 200 sont morts à l'hôpital. Ils ont utilisé 80 % de l'ensemble de données pour s'entraîner, et 20 pour cent pour tester le modèle.
En utilisant les données des 24 premières heures, le modèle a regroupé les patients en sous-populations présentant des différences cliniques importantes. Deux sous-populations, par exemple, contenait des patients avec une pression artérielle élevée au cours des premières heures, mais un a diminué avec le temps, tandis que l'autre a maintenu l'élévation tout au long de la journée. Cette sous-population avait le taux de mortalité le plus élevé.
En utilisant ces sous-populations, le modèle a prédit la mortalité des patients au cours des 48 heures suivantes avec une spécificité et une sensibilité élevées, et diverses autres mesures. Le modèle multitâche a nettement surperformé un modèle global de plusieurs points de pourcentage.
Prochain, les chercheurs visent à utiliser davantage de données des dossiers de santé électroniques, tels que les traitements que reçoivent les patients. Ils espèrent aussi, à l'avenir, pour entraîner le modèle à extraire des mots-clés à partir de notes cliniques numérisées et d'autres informations.
Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.