• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Analyse de données volumineuses pour les nuls

    Crédits :dani3315, Shutterstock

    Le Big Data est toujours une affaire d'élite :seules les entreprises les plus averties et les plus riches en informatique ont une chance d'effleurer la surface de son potentiel. Tout cela pourrait être sur le point de changer grâce à une plateforme d'analyse Big Data développée dans le cadre du projet TOREADOR, qui traitera automatiquement tous les problèmes majeurs liés à la préparation des données à la demande.

    "Les attentes du Big Data sont très élevées, mais l'écart entre l'ambition et l'exécution est encore grand, surtout pour les PME, » soupire le docteur Ernesto Damiani. Et il faut qu'il le sache :depuis début 2016, Le Dr Damiani a dirigé un consortium de 10 personnes examinant les raisons de ces fortunes diverses et les solutions possibles.

    Si relativement peu de PME ont intégré l'analyse Big Data dans leurs offres ou leurs processus internes, c'est principalement pour deux raisons. Le premier est un manque de compétence en analyse Big Data, comme l'explique le Dr Damiani. Une entreprise désireuse, par exemple, pour adapter ses offres au comportement des clients à l'aide d'une application gratuite, il faudrait recourir à un conseil très coûteux. C'est actuellement le seul moyen de mapper des objectifs commerciaux à une classe de solutions de science et technologie des données.

    « Concrètement, le dossier de projet pourrait ressembler à « collecter les événements générés par les applications des principaux clients et les utiliser pour former un classificateur multicatégorie à forêt aléatoire évolutif de leur comportement à déployer sur un service de cloud public », " il dit.

    La deuxième raison est le long temps de déploiement et, de nouveau, le coût prohibitif des campagnes Big Data même lorsque l'approche data science est déjà identifiée. Ensemble, ces problèmes ont éloigné les PME et les entreprises non averties des TIC de l'analyse de Big Data, bien qu'ils représentent une part substantielle de l'épine dorsale manufacturière de l'UE.

    La méthodologie et la boîte à outils TOREADOR (TrustwOrthy model-awaRE Analytics Data platefORm) offrent une solution à ces deux problèmes :elles automatisent et banalisent l'analyse Big Data, tout en rendant son adaptation aux exigences des clients spécifiques à un domaine beaucoup plus facile qu'auparavant.

    Le framework TOREADOR prend en charge deux transformations automatisées. Le premier part d'un modèle déclaratif lisible par machine qui collecte les objectifs du propriétaire des données, et se termine par un modèle procédural sémantique indépendant de la technologie décrivant le calcul à effectuer. Puis, la seconde transformation s'appuie sur le modèle procédural pour calculer un modèle de déploiement dépendant de la technologie. Ce dernier peut être exécuté sur une plateforme Apache, dans les locaux du client, sur des services cloud commerciaux comme AWS, en tant que code Python exécutable sur la plateforme Azure ou en tant que conteneur Docker.

    "Nos modèles déclaratifs peuvent collecter de manière interactive les objectifs commerciaux des campagnes Big Data et permettre à la boîte à outils TOREADOR de fournir des conseils automatiques sur la faisabilité des solutions. Nos modèles procéduraux fournissent ensuite une description innovante du calcul d'analyse Big Data dans la sémantique OWL/S- normes conscientes, et nos compilateurs traduisent ces modèles procéduraux en workflows entièrement exécutables ou même en code Python nativement parallélisé. Nous envisageons un processus de développement itératif, où les utilisateurs non avertis en informatique peuvent rapidement mettre en place une campagne en générant un workflow exécutable sur un service cloud public, puis, si nécessaire, appelez les développeurs pour générer du code Python autonome, " explique le Dr Damiani.

    Les partenaires du projet ont déjà identifié quatre pilotes industriels dans les domaines de la maintenance prédictive des moteurs d'avions, gestion prédictive des centrales solaires, analyse des journaux d'applications métier, et analyse des flux de clics pour les applications de commerce électronique.

    « La plateforme TOREADOR est disponible et a été déployée sur les quatre sites pilotes. Elle a également été mise à disposition en pré-version gratuite pour les membres sélectionnés de la communauté TOREADOR, qui est composé d'entreprises européennes (dont plusieurs PME) recrutées avec l'aide de TAIGER (Espagne), une PME innovante du consortium TOREADOR. Des détails sur ces adopteurs précoces sont disponibles sur notre site Web. Outre, la méthodologie TOREADOR a été diffusée à d'autres projets européens utilisant des campagnes Big Data comme EVOTION, " dit le Dr Damiani.

    Le projet devrait s'achever fin 2018. D'ici là, le consortium a l'intention de continuer à élargir le catalogue de services disponibles sur la plateforme et de fournir des exemples de campagnes Big Data activées par TOREADOR, y compris la formation et le déploiement de modèles avancés d'apprentissage automatique.


    © Science https://fr.scienceaq.com