Les chercheurs ont publié un référentiel de plus de 350, 000 radiographies thoraciques détaillées, qui est gratuit et ouvert aux universitaires, clinique, et les enquêteurs industriels. Crédit :Massachusetts Institute of Technology
Vision par ordinateur, ou la méthode de donner aux machines la capacité de traiter les images de manière avancée, a fait l'objet d'une attention accrue de la part des chercheurs au cours des dernières années. C'est un terme large destiné à englober tous les moyens par lesquels les images peuvent être utilisées pour atteindre des objectifs médicaux. Les applications vont de la numérisation automatique de photos prises sur des téléphones portables à la création de rendus 3D qui facilitent l'évaluation des patients au développement de modèles algorithmiques pour une utilisation en salle d'urgence dans les zones mal desservies.
Comme l'accès à un plus grand nombre d'images est susceptible de fournir aux chercheurs un volume de données idéal pour développer des algorithmes meilleurs et plus robustes, une collection de visuels enrichis, ou effacé des détails d'identification des patients, puis mis en évidence dans les zones critiques, peut avoir un potentiel énorme pour les chercheurs et les radiologues qui s'appuient sur des données photographiques dans leur travail.
La semaine dernière, le Laboratoire de physiologie computationnelle du MIT, une partie de l'Institute for Medical Engineering and Science (IMES) dirigé par le professeur Roger Mark, a lancé un aperçu de leur base de données MIMIC-Chest X-Ray (MIMIC-CXR), un référentiel de plus de 350, 000 radiographies thoraciques détaillées recueillies sur cinq ans au Beth Israel Deaconess Medical Center de Boston. Le projet, comme le précédent MIMIC-III du laboratoire, qui abrite les données des patients en soins intensifs de plus de 40, 000 séjours en réanimation, est gratuit et ouvert aux universitaires, clinique, et les chercheurs industriels via la ressource de recherche PhysioNet. Il représente la plus grande sélection de radiographies pulmonaires accessibles au public à ce jour.
Avec accès au MIMIC-CXR, financé par Philips Research, les utilisateurs enregistrés et leurs cohortes peuvent plus facilement développer des algorithmes pour quatorze des résultats les plus courants d'une radiographie pulmonaire, y compris la pneumonie, cardiomégalie (hypertrophie cardiaque), œdème (excès de liquide), et un poumon perforé. En associant des marqueurs visuels à des diagnostics précis, les machines peuvent facilement aider les cliniciens à tirer des conclusions plus précises plus rapidement et ainsi, traiter plus de cas en moins de temps. Ces algorithmes pourraient s'avérer particulièrement bénéfiques pour les médecins travaillant dans des hôpitaux sous-financés et en sous-effectif.
"Les zones rurales n'ont généralement pas de radiologues, " déclare le chercheur scientifique Alistair E. W. Johnson, co-développeur de la base de données avec Tom J. Pollard, Nathaniel R. Greenbaum, et Matthew P. Lungren; Seth J. Berkowitz, directeur de l'innovation informatique en radiologie; Chih-ying Deng de la faculté de médecine de Harvard; et Steven Horng, directeur adjoint de l'informatique de médecine d'urgence à Beth Israel. "Si vous avez une salle pleine de patients malades et que vous n'avez pas le temps de consulter un radiologue expert, c'est un endroit où un modèle peut aider."
À l'avenir, le laboratoire espère lier l'archive de rayons X au MIMIC-III, formant ainsi une base de données qui comprend à la fois les données et les images des patients en soins intensifs. Il y en a actuellement plus de 9 000 utilisateurs enregistrés MIMIC-III accédant aux données de soins intensifs, et le MIMIC-CXR serait une aubaine pour ceux en médecine de soins intensifs qui cherchent à compléter les données cliniques avec des images.
Un autre atout de la base de données réside dans son timing. Des chercheurs du Stanford Machine Learning Group et du Stanford Center for Artificial Intelligence in Medicine and Imaging ont publié un ensemble de données similaire en janvier, recueillies sur 15 ans à l'hôpital de Stanford. Le Laboratoire de physiologie computationnelle du MIT et les groupes de l'Université de Stanford ont collaboré pour garantir que les deux ensembles de données publiés puissent être utilisés avec un minimum de travail pour le chercheur intéressé.
"Avec les études monocentriques, vous n'êtes jamais sûr que ce que vous avez trouvé est vrai pour tout le monde, ou une conséquence du type de patients que l'hôpital reçoit, ou la façon dont il prodigue ses soins, " dit Johnson. " C'est pourquoi les essais multicentriques sont si puissants. En travaillant avec Stanford, nous avons essentiellement donné aux chercheurs du monde entier les moyens de mener leurs propres essais multicentriques sans avoir à dépenser les millions de dollars que cela coûte généralement. »
Comme avec MIMIC-III, les chercheurs pourront accéder à MIMIC-CXR en suivant d'abord une formation sur la gestion des sujets humains, puis en acceptant de citer l'ensemble de données dans leurs travaux publiés.
"La prochaine étape est les rapports en texte libre, " dit Johnson. "Nous nous dirigeons davantage vers une histoire complète. Lorsqu'un radiologue examine une radiographie pulmonaire, ils savent qui est la personne et pourquoi ils sont là. Si nous voulons faciliter la vie des radiologues, les modèles ont besoin de savoir qui est la personne, trop."
Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.