Les chercheurs du MIT décrivent un algorithme d'apprentissage automatique qui peut enregistrer plus de 1 scans cérébraux et autres images 3D. 000 fois plus rapidement en utilisant de nouvelles techniques d'apprentissage. Crédit : Institut de technologie du Massachusetts
L'enregistrement d'images médicales est une technique courante qui consiste à superposer deux images, tels que l'imagerie par résonance magnétique (IRM), comparer et analyser en détail les différences anatomiques. Si un patient a une tumeur au cerveau, par exemple, les médecins peuvent superposer un scanner cérébral d'il y a plusieurs mois sur un scanner plus récent pour analyser de petits changements dans l'évolution de la tumeur.
Ce processus, cependant, peut souvent prendre deux heures ou plus, comme les systèmes traditionnels alignent méticuleusement chacun des potentiellement un million de pixels dans les scans combinés. Dans une paire d'articles de conférence à venir, Les chercheurs du MIT décrivent un algorithme d'apprentissage automatique qui peut enregistrer plus de 1 scans cérébraux et autres images 3D. 000 fois plus rapidement en utilisant de nouvelles techniques d'apprentissage.
L'algorithme fonctionne par "apprentissage" tout en enregistrant des milliers de paires d'images. Ce faisant, il acquiert des informations sur la façon d'aligner les images et estime certains paramètres d'alignement optimaux. Après l'entrainement, il utilise ces paramètres pour mapper tous les pixels d'une image à une autre, tout à la fois. Cela réduit le temps d'enregistrement à une minute ou deux en utilisant un ordinateur normal, ou moins d'une seconde en utilisant un GPU avec une précision comparable aux systèmes de pointe.
"Les tâches d'alignement d'une IRM cérébrale ne devraient pas être si différentes lorsque vous alignez une paire d'IRM cérébrales ou une autre, " déclare le co-auteur des deux articles Guha Balakrishnan, un étudiant diplômé du Laboratoire d'informatique et d'intelligence artificielle (CSAIL) et du Département d'ingénierie et d'informatique (EECS) du MIT. « Il y a des informations que vous devriez pouvoir conserver sur la façon dont vous effectuez l'alignement. Si vous êtes en mesure d'apprendre quelque chose de l'enregistrement d'image précédent, vous pouvez effectuer une nouvelle tâche beaucoup plus rapidement et avec la même précision."
Les articles sont présentés à la Conférence sur la vision par ordinateur et la reconnaissance de formes (CVPR), tenue cette semaine, et à la Conférence sur l'imagerie médicale et les interventions assistées par ordinateur (MICCAI), tenue en septembre. Les co-auteurs sont :Adrian Dalca, un post-doctorat au Massachusetts General Hospital et au CSAIL; Amy Zhao, un étudiant diplômé au CSAIL; Mert R. Sabuncu, un ancien post-doctorant CSAIL et maintenant professeur à l'Université Cornell; et John Guttag, le professeur Dugald C. Jackson en génie électrique au MIT.
Conservation des informations
Les IRM sont essentiellement des centaines d'images 2D empilées qui forment des images 3D massives, appelé "volumes, " contenant un million de pixels 3D ou plus, appelés « voxels ». Par conséquent, c'est très long d'aligner tous les voxels du premier volume avec ceux du second. De plus, les scans peuvent provenir de différentes machines et avoir des orientations spatiales différentes, ce qui signifie que la correspondance des voxels est encore plus complexe en termes de calcul.
"Vous avez deux images différentes de deux cerveaux différents, les mettre les uns sur les autres, et vous commencez à remuer l'un jusqu'à ce que l'un s'adapte à l'autre. Mathématiquement, cette procédure d'optimisation est longue, " dit Dalca, auteur principal sur l'article CVPR et auteur principal sur l'article MICCAI.
Ce processus devient particulièrement lent lors de l'analyse d'analyses provenant de grandes populations. Des neuroscientifiques analysant les variations des structures cérébrales chez des centaines de patients atteints d'une maladie ou d'une affection particulière, par exemple, pourrait prendre des centaines d'heures.
C'est parce que ces algorithmes ont un défaut majeur :ils n'apprennent jamais. Après chaque inscription, ils rejettent toutes les données relatives à l'emplacement des voxels. "Essentiellement, ils repartent de zéro avec une nouvelle paire d'images, " dit Balakrishnan. " Après 100 inscriptions, vous devriez avoir appris quelque chose de l'alignement. C'est ce que nous exploitons."
L'algorithme des chercheurs, appelé "VoxelMorph, " est alimenté par un réseau de neurones convolutifs (CNN), une approche d'apprentissage automatique couramment utilisée pour le traitement d'images. Ces réseaux se composent de nombreux nœuds qui traitent l'image et d'autres informations à travers plusieurs couches de calcul.
Dans l'article du CVPR, les chercheurs ont entraîné leur algorithme sur 7, 000 scintigraphies cérébrales IRM accessibles au public, puis testées sur 250 scintigraphies supplémentaires.
Pendant la formation, les scintigraphies cérébrales ont été introduites dans l'algorithme par paires. En utilisant un CNN et une couche de calcul modifiée appelée un transformateur spatial, la méthode capture les similitudes des voxels dans une analyse IRM avec des voxels dans l'autre analyse. Ce faisant, l'algorithme apprend des informations sur les groupes de voxels, tels que les formes anatomiques communes aux deux scans, qu'il utilise pour calculer des paramètres optimisés qui peuvent être appliqués à n'importe quelle paire de scans.
Lorsqu'il est alimenté de deux nouvelles numérisations, une simple "fonction" mathématique utilise ces paramètres optimisés pour calculer rapidement l'alignement exact de chaque voxel dans les deux scans. En bref, le composant CNN de l'algorithme obtient toutes les informations nécessaires pendant l'entraînement afin que, lors de chaque nouvelle inscription, l'ensemble de l'enregistrement peut être exécuté à l'aide d'un seul, évaluation de fonction facilement calculable.
Les chercheurs ont découvert que leur algorithme pouvait enregistrer avec précision tous leurs 250 tests de scintigraphie cérébrale - ceux enregistrés après l'ensemble d'entraînement - en deux minutes à l'aide d'une unité centrale traditionnelle, et en moins d'une seconde à l'aide d'une unité de traitement graphique.
Surtout, l'algorithme est "non supervisé, " ce qui signifie qu'il ne nécessite pas d'informations supplémentaires au-delà des données d'image. Certains algorithmes d'enregistrement intègrent des modèles CNN mais nécessitent une " vérité terrain, ", ce qui signifie qu'un autre algorithme traditionnel est d'abord exécuté pour calculer des enregistrements précis. L'algorithme des chercheurs maintient sa précision sans ces données.
L'article MICCAI développe un algorithme VoxelMorph raffiné qui "indique à quel point nous sommes sûrs de chaque enregistrement, " dit Balakrishnan. Il garantit également l'enregistrement " douceur, " ce qui signifie qu'il ne produit pas de plis, des trous, ou des distorsions générales dans l'image composite. L'article présente un modèle mathématique qui valide la précision de l'algorithme à l'aide de ce qu'on appelle un score de dés, une métrique standard pour évaluer la précision des images superposées. Dans 17 régions du cerveau, l'algorithme VoxelMorph raffiné a obtenu la même précision qu'un algorithme d'enregistrement de pointe couramment utilisé, while providing runtime and methodological improvements.
Beyond brain scans
The speedy algorithm has a wide range of potential applications in addition to analyzing brain scans, disent les chercheurs. MIT colleagues, for instance, are currently running the algorithm on lung images.
The algorithm could also pave the way for image registration during operations. Various scans of different qualities and speeds are currently used before or during some surgeries. But those images are not registered until after the operation. When resecting a brain tumor, for instance, surgeons sometimes scan a patient's brain before and after surgery to see if they've removed all the tumor. If any bit remains, they're back in the operating room.
With the new algorithm, Dalca says, surgeons could potentially register scans in near real-time, getting a much clearer picture on their progress. "Aujourd'hui, they can't really overlap the images during surgery, because it will take two hours, and the surgery is ongoing" he says. "However, if it only takes a second, you can imagine that it could be feasible."
Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.