• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Boîtes à outils légères intelligentes avec des données lourdes

    Crédit :Centre John Innes

    Un libre, Une boîte à outils open source pour aider les chercheurs à gérer la surcharge de gestion des données a été conçue par l'équipe informatique du John Innes Center.

    La boîte à outils, appelé "dtool, " est une suite de logiciels permettant de gérer les données scientifiques et de les rendre accessibles aux chercheurs de première ligne travaillant dans plusieurs domaines de projets.

    Il fonctionne en empaquetant les données et les métadonnées - des informations qui identifient les données - dans des boîtes ou des ensembles de données pratiques.

    Ces ensembles autonomes de données et de métadonnées facilitent le déplacement des ensembles de données et la création de copies de sauvegarde à distance.

    Les outils fonctionnent à la fois avec les systèmes de fichiers traditionnels ainsi qu'avec les options cloud telles qu'Amazon S3 et Microsoft Azure, permettant aux chercheurs de choisir la solution de stockage la mieux adaptée à leurs besoins et à leur budget.

    Le système permet aux chercheurs de trouver rapidement des ensembles de données d'intérêt sans avoir à accéder et à gérer une base de données centrale. Les métadonnées empaquetées peuvent être utilisées pour vérifier l'intégrité des données dans la boîte.

    L'équipe du John Innes Center décrit les avantages de dtool dans un article publié dans PeerJ – le Journal of Life and Environmental Sciences.

    Ils disent que la boîte à outils offre une tranquillité d'esprit parce que les chercheurs savent que les données qui sous-tendent les résultats scientifiques sont sûres, consultable et accessible dans un environnement de recherche hautement distribué tel que le Centre John Innes.

    Dr Tjelvar Olsson, Gestionnaire principal des données scientifiques et des infrastructures au John Innes Centre, qui est l'un des créateurs du système, a déclaré:"Au John Innes Center, nous avons 40 groupes de recherche différents traitant d'énormes volumes de toutes sortes de données.

    "Nous voulons que plus de personnes utilisent dtool pour gérer leurs données. Nous l'avons conçu de manière à s'adapter à leur façon de travailler, un poids léger, solution utilisée de manière minimale qui s'ajoute à ce qu'ils font déjà."

    L'un des premiers utilisateurs de dtool est l'équipe du Dr Brande Wulff qui travaille sur la résistance aux maladies du blé au John Innes Centre.

    Les progrès des technologies telles que le séquençage génétique et la biologie des systèmes informatiques ont contribué à une explosion des volumes et des types de données. Bien que cela ait conduit à des avancées majeures dans la science végétale et microbienne, cela a conduit à des défis importants dans la gestion et le traitement des données pour les chercheurs de première ligne.

    Dr Matthew Hartley, Responsable de l'équipe informatique du JIC, qui a aidé à concevoir dtool, a déclaré que l'impact se faisait déjà sentir.

    "La gestion des données à grande échelle est l'un des plus grands défis de la recherche biologique computationnelle. dtool a rendu le stockage de nos données moins cher, nous a donné la tranquillité d'esprit et a accéléré nos recherches.".

    "La gestion légère des données avec dtool" est publié dans PairJ .


    © Science https://fr.scienceaq.com