La Data Quality

businessman-making-presentation-with-his-colleagues-business-strategy-digital-layer-effect-office-as-concept

La “data” est devenue un asset, et sa qualité est au coeur de la performance de l’entreprise.

Les données sont rattachées à 2 enjeux étroitement imbriqués : 

  • L’optimisation opérationnelle : libérer du temps aux acteurs internes et fiabiliser ce qui est exposé dans les “fronts digitaux“.
  • Maîtriser l’information : permettre aux experts de la “data” de valoriser les données, notamment au sein d’analyses et d’indicateurs métiers.
data quality book mockup

1. Il existe un socle d'exigences communes qui définissent les principaux critères de qualité

▶ La complétude.

▶ L’exactitude et la cohérence entre les données. 

▶ Le respect des valeurs et des formats. 

▶ L’unicité.

▶ Et aussi la validité dans le temps : la donnée doit être la plus récente et toujours exacte. 

La gouvernance s’organise autour des bonnes pratiques suivantes :

▶ Un ” profiling ” de la donnée pour la comprendre, tant sur le plan de sa structure que de sa qualité.

▶ Une organisation et un suivi/reporting du cycle de vie de la donnée.

▶ Des ” Data Owners ” pour prioriser les besoins des équipes métiers.

▶ Des ” Product Owners ” pour piloter la mise à niveau des applications.

▶ Une équipe de ” Data Stewards ” pour gérer les données au quotidien.

3. Préparer les données est la clé d'entrée vers la qualité de l'information

👉🏼 Rassembler, combiner, structurer et organiser les données.

▶Le cataloging et l’attention portée aux métadonnées qui faciliteront la recherche et l’extraction.

▶Des ” workflows ” de transformation (complétude, correction, validation).

▶Le stockage selon un modèle qui accélère l’accès aux données.

▶L’enrichissement grâce au croisement avec des bases externes, pour corriger ou compléter certaines valeurs.

▶Des traitements algorithmiques et/ou de ML pour ajouter des indicateurs qui qualifient l’information et augmentent son utilisabilité.

A retenir

Pour associer efficacité opérationnelle et pilotage des données, une réponse s’impose de plus en plus : la centralisation des données au sein des plateformes :

▶ Pour les données référentielles : les MDM (Master Data Management).

▶ Pour toutes les données : les plateformes de données d’entreprise, et de plus en plus en mode “Lakehouse”.

La clé de réussite ? 

👉🏼 Mêler expertise technique et expertise métier en capitalisant sur les savoirs des Data Engineers et des Data Analysts.

NOTRE EXPERTISE AU SERVICE
DE VOS MÉTIERS