Crédit :George Rudy, Shutterstock
Le Big Data est un changement si énorme pour les entreprises qu'il peut facilement sembler écrasant. Le projet BigDataEurope rencontre à mi-chemin les entreprises intéressées en fournissant une pile intégrée d'outils pour manipuler, publier et utiliser des ressources de données à grande échelle.
Au vu de la très longue liste de projets financés dans le cadre d'Horizon 2020 et du large éventail de sujets couverts, il serait facile d'oublier que le plus grand programme de recherche et d'innovation de l'UE à ce jour vise à répondre à sept préoccupations sociétales majeures :la santé et le bien-être; nourriture, agriculture et bioéconomie; énergie; transport; changement climatique; liberté et sécurité; et la place de l'Europe dans un monde en mutation.
Ce qu'il est encore plus facile d'oublier, c'est que ces sujets en apparence très différents et les secteurs d'activités associés partagent tous au moins un trait commun :comment ils pourraient bénéficier de l'innovation numérique, et plus précisément du Big Data.
Pour s'assurer qu'ils le font, le BigDataEurope (Intégration du Big Data, Software and Communities for Addressing Europe's Societal Challenges) a créé sept communautés et a tenté de mieux comprendre ce dont elles auraient besoin du Big Data. Le résultat est une plate-forme capable d'ingérer des données provenant de diverses sources, qui peuvent être adaptés pour cibler des applications innovantes à travers les sept défis H2020.
Quelles lacunes avez-vous cherché à combler avec ce projet et en quoi est-ce important ?
Il est largement reconnu que l'analyse de grandes quantités de données (Big Data) influence profondément notre économie et notre société dans son ensemble. Cependant, il est important que les technologies correspondantes ne soient pas seulement disponibles pour un petit cercle d'entreprises, mais peut également être largement utilisé par les petites entreprises et initiatives ainsi que dans la recherche et les universités.
BigDataEurope a d'abord comblé cette lacune en fournissant une plate-forme pour la réalisation d'applications Big Data, puis en échangeant sur les besoins et les candidatures pilotes avec les collectivités représentatives des enjeux sociétaux identifiés par le programme-cadre H2020.
Qu'est-ce qui rend votre approche innovante ?
De nombreux événements organisés avec des groupes de parties prenantes nous ont fait prendre conscience qu'en plus du volume et de la vélocité, la variété des données est un aspect clé à traiter dans les applications sociétales.
Pour répondre à cette exigence, nous avons conçu et produit une couche de description de données sémantiques pour le Big Data. Cette couche utilise des graphiques de vocabulaire et de connaissances, et permet aux communautés de développer une compréhension commune de leurs données tout en reliant et en intégrant ces données à un niveau technique.
Quelles ont été les principales difficultés que vous avez rencontrées pour rassembler tous ces groupes de parties prenantes et sources de données, et comment les as-tu surmontés ?
Un défi majeur résidait dans les différentes terminologies, cultures et pratiques trouvées dans les groupes de parties prenantes, ce qui a également entraîné des exigences et des points de vue très différents. Tandis que, par exemple, les données ouvertes jouent déjà un rôle clé dans les applications de mobilité, sécurité des données, la confidentialité et l'anonymisation sont d'une importance primordiale dans les scénarios de soins de santé.
Nous avons relevé ce défi en évitant de développer une plateforme unique, au lieu d'intégrer des composants qui remplissent un objectif très spécifique comme le traitement de données en streaming ou l'anonymisation. Par conséquent, l'utilisateur peut combiner et intégrer les composants de gestion de données les plus appropriés pour tout scénario d'application concret de la plate-forme BigDataEurope.
Quels sont les avantages d'intégrer toutes ces données ? Pouvez-vous donner un exemple concret ?
Le projet a produit sept démonstrateurs démontrant la valeur des données intégrées pour les différents défis sociétaux. Celles-ci comprenaient par exemple la prévision du trafic routier et des embouteillages sur la base de données de capteurs historiques et actuelles en combinaison avec des informations provenant des réseaux sociaux.
Autre exemple, l'agriculture de précision visant à apporter aux plantes comme la vigne une nutrition optimale, fertilisation et irrigation basées sur le climat et les données de recherche.
Les résultats du projet ont-ils répondu à vos attentes initiales ? Comment?
Dans l'ensemble, le besoin de gérer la variété des données était quelque chose que nous attendions et a été confirmé par les réunions des parties prenantes et de la communauté. Grâce à la démarche d'intégration sémantique suivie par la plateforme, nous avons réussi à faire un pas en avant, mais nous sommes encore légèrement éloignés de la vision d'intégrer et d'analyser de manière transparente de grandes quantités de données agrégées avec un effort minimal. Outre, la prise en compte de la confidentialité des données et de la souveraineté des fournisseurs de données nécessitera plus d'attention à l'avenir.
Comment les parties prenantes intéressées peuvent-elles commencer à utiliser votre plateforme ?
La plateforme, la documentation et les implémentations pilotes sont entièrement open source et disponibles pour la réutilisation. Aussi, il existe un certain nombre de partenaires du consortium BigDataEurope (y compris par exemple Fraunhofer) qui sont prêts à fournir assistance et soutien.
Quels sont vos plans de suivi ?
Les membres du consortium poursuivent des recherches sur le thème de la gestion du Big Data dans leurs propres domaines. Par exemple, il existe déjà plusieurs projets H2020 récemment lancés qui continuent de maintenir des parties de la plate-forme BigDataEurope et d'approfondir son application dans les domaines de la santé et des sciences de la vie.