Avec chaque nouvelle, les concepts d'information sur les soins de santé par exploration de données sont encore plus élevés dans l'agenda de la recherche et des politiques dans ce domaine. Les informations cliniques et les données génétiques contenues dans les dossiers de santé électroniques (DSE) représentent une source majeure d'informations utiles pour la recherche biomédicale, mais il peut être difficile d'y accéder de manière utile.
Écrivant dans l'International Journal of Intelligent Engineering Informatics, Hassan Mahmoud et Enas Abbas de l'Université Benha et de l'Université Ibrahim Fathy Ain Shams, en Egypte, discuter du besoin de méthodes innovantes et efficaces pour représenter cette énorme quantité de données. Ils soulignent qu'il existe des techniques d'exploration de données ainsi que des techniques basées sur des ontologies qui peuvent jouer un rôle majeur dans la détection efficace et précise des syndromes chez les patients. Un syndrome est défini comme un ensemble de symptômes médicaux concomitants et d'indicateurs associés à une maladie ou un trouble donné.
L'équipe a passé en revue l'état de l'art et s'est également concentrée sur l'examen des techniques d'exploration de données bien connues telles que les arbres de décision (J48), Naïf Bayes, perceptron multicouche (MLP), et les techniques de forêt aléatoire (RF) et comparé leurs performances respectives dans la classification d'un syndrome particulier, cardiopathie.
L'équipe conclut que dans des expériences avec un ensemble de données public, le classificateur RF offre les meilleures performances en termes de précision. À l'avenir, ils suggèrent que l'exploration de données bénéficiera aux soins de santé et à la médecine de manière significative pour la construction d'un système capable de détecter un syndrome spécifique.