(L-R) Fuad Jamour, Panos Kalnis et Yanzhao Chen construisent des systèmes et des algorithmes pour le traitement et l'analyse de très grands ensembles de données. Crédit : 2019 KAUST
Pour résoudre l'un des principaux obstacles de la science des mégadonnées, Les chercheurs de KAUST ont créé un cadre pour la recherche de très grands ensembles de données qui s'exécute facilement sur différentes architectures informatiques. Leur réalisation permet aux chercheurs de se concentrer sur l'avancement du moteur de recherche, ou moteur de requête, lui-même plutôt que de coder minutieusement pour des plates-formes informatiques spécifiques.
Les mégadonnées sont l'un des aspects les plus prometteurs et les plus difficiles du monde d'aujourd'hui, riche en informations. Alors que les ensembles d'informations énormes et en constante expansion, telles que des données collectées en ligne ou des informations génétiques, pourrait contenir des idées puissantes pour la science et l'humanité, le traitement et l'interrogation de toutes ces données nécessitent des techniques très sophistiquées.
De nombreuses approches différentes pour interroger le Big Data ont été explorées. Mais l'un des plus puissants et des plus efficaces en termes de calcul est basé sur l'analyse des données avec une structure triplestore sujet-prédicat-objet de la forme (par exemple, Pomme, est un, fruit). Cette structure se prête à être traitée comme un graphe avec des arêtes et des sommets, et cette caractéristique a été utilisée pour coder des moteurs de requêtes pour des architectures informatiques spécifiques pour une efficacité maximale. Cependant, de telles approches spécifiques à l'architecture ne peuvent pas être facilement portées sur différentes plates-formes, limitant les opportunités d'innovation et de progrès dans l'analyse.
« Les systèmes informatiques modernes fournissent diverses plates-formes et accélérateurs, et les programmer peut être intimidant et prendre du temps, " disent Fuad Jamour et Yanzhao Chen, doctorat candidats dans le groupe de Panos Kalnis au Centre de recherche en informatique extrême de la KAUST. "Notre groupe de recherche se concentre sur la création de systèmes et d'algorithmes pour le traitement et l'analyse de très grands ensembles de données. Cette recherche répond au désir d'écrire un programme une seule fois, puis de l'utiliser sur différentes plates-formes."