Crédit :CC0 Domaine public
Les lacs de données permettent d'ajouter des informations à un système sans prétraitement ni modélisation. Comparez cela avec une base de données conventionnelle où les données doivent être fournies d'une manière beaucoup plus raffinée et formelle. Ainsi, un lac de données offre une vitesse d'entrée beaucoup plus rapide. Cependant, comme le montre une recherche au Brésil, même si un lac de données préserve le plus haut niveau de granularité des données, cette flexibilité utile peut également être problématique. "Si non géré, il est facile de perdre le contrôle du référentiel en raison du volume qu'il contient et de sa croissance, " explique l'équipe.
Les chercheurs expliquent en outre que les lacs de données ne comportent aucune des sémantiques d'une base de données conventionnelle, mais si cela peut être avantageux pour éviter certains types de biais lors de la réextraction et de l'analyse des jours, cela signifie que la compréhension du contenu du lac de données peut devenir une tâche assez lourde. Cette, l'équipe suggère, a peut-être sapé l'adoption et l'utilisation généralisées des lacs de données dans l'environnement de l'entreprise et entravé l'acceptation de cet outil utile en raison de certaines idées fausses sur la façon dont ils pourraient être utilisés dans les efforts de science des données.
L'équipe s'est maintenant tournée vers des modèles de gestion des connaissances pour les aider à résoudre les problèmes associés à l'utilisation des lacs de données et à enrichir les données flottantes pour améliorer la convivialité des informations. Ils ajoutent également que grâce à l'utilisation d'une plate-forme de portail de données et des métadonnées associées, ils estiment que leur approche fournirait un accès facile au lac de données en maintenant et en renforçant son utilité et en empêchant son dénigrement dans un soi-disant marais de données.