Data

data lineage

data lineage

Le data lineage est l’historique des données, y compris leur cheminement au cours de leur existence au sein d’une organisation. Le data lineage est une partie obligatoire de la conformité aux politiques de données des entreprises et des gouvernements. Le suivi de l’historique des données est assuré par la documentation et les logiciels de data lineage. Sans moyen d’identifier où les erreurs de données sont introduites dans l’environnement, il est difficile pour les gestionnaires de données d’identifier et de résoudre les problèmes de qualité des données.
Grâce à des outils efficaces, la gouvernance des données peut être facilitée par la documentation du parcours complet des données dans l’organisation. La documentation du data lineage permet de simplifier deux des principales préoccupations de la gouvernance des données en ce qui concerne les effets des modifications des données : l’analyse des causes profondes et l’analyse de l’impact sur l’activité (BIA). Une compréhension claire des causes profondes et des impacts des problèmes liés aux données est facilitée par la connaissance de tout ce qui est arrivé aux données depuis leur création.

Dans le développement de logiciels, le suivi du data lineage peut aider à concilier les difficultés entre les meilleures pratiques de développement Agile, les réglementations de gouvernance des données et la politique de l’entreprise en matière de données. Les outils et les procédures de Data lineage permettent de savoir où les défauts des données ont été introduits, ce qui peut faciliter les diagnostics et les corrections. La mise en œuvre du suivi du lignage des données peut s’avérer difficile et souvent considérée comme une faible priorité. Cependant, une correction plus précoce signifie une moindre propagation des erreurs, ce qui signifie que la mise en œuvre d’outils de lignage des données au début du processus s’avère souvent valoir la peine.

Ecrire un commentaire