DATA GOUVERNANCE
11/10/2024
Trois flux de données Photo de Marie de Vesvrotte
Marie de Vesvrotte
Responsable Marketing

Qu'est-ce que le dictionnaire de données ?

Dictionnaire de données : de quoi parle-t-on ?

Un dictionnaire de données est un référentiel centralisé qui stocke des métadonnées détaillées sur les données contenues dans une base de données ou un système d'information. Il fournit une documentation exhaustive sur la structure, la signification, les relations et l'utilisation des données.  

En d'autres termes, le dictionnaire de données agit comme un guide exhaustif qui aide à comprendre et à interpréter les données stockées dans un système. Il fournit des descriptions précises de chaque élément de données, telles que leur nom, leur type, leur taille, leur format, leur origine, leur rôle dans le système, leurs relations avec d'autres données, etc.

Un dictionnaire de données peut être utile pour plusieurs raisons : 

  • Documentation complète : il fournit une documentation détaillée sur la structure et la signification des données, ce qui facilite la compréhension pour les utilisateurs et les développeurs.
  • Consistance et normalisation : en définissant clairement les règles et les normes pour la collecte et le stockage des données, le dictionnaire de données favorise la cohérence et la normalisation des pratiques de gestion des données au sein d'une organisation.
  • Facilitation du développement et de la maintenance : en fournissant des informations précises sur les données, cet outil facilite le développement de nouveaux systèmes, ainsi que la maintenance et la mise à jour des systèmes existants.
  • Sécurité et confidentialité : en identifiant les données sensibles et en spécifiant les règles d'accès appropriées, il contribue à renforcer la sécurité et la confidentialité des informations.

Que trouve-t-on dans un dictionnaire de données ? 

Un dictionnaire de données fournit une documentation complète et organisée sur toutes les caractéristiques et les aspects des données. Voici une liste des éléments principaux qui composent le Data Dictionary : 

  • Noms des données : les noms attribués à chaque élément de données, qui permettent de les identifier de manière unique.
  • Description : des descriptions détaillées de chaque élément de données, expliquant sa signification, son contexte et son utilisation.
  • Type de données : la nature ou le type de données, par exemple, texte, nombre entier, décimal, date, etc.
  • Format : les spécifications sur la manière dont les données sont stockées ou représentées, comme le format de date, le nombre de décimales, etc.
  • Taille : la taille ou la longueur maximale des données, particulièrement pertinent pour les chaînes de caractères ou les champs numériques.
  • Contraintes : les règles ou les contraintes qui s'appliquent aux données, telles que les valeurs minimales et maximales, les clés étrangères, etc.
  • Relation avec d'autres données : les liens ou les relations entre différentes données, notamment les clés primaires et étrangères dans une base de données relationnelle.
  • Origine des données : la source ou la manière dont les données ont été recueillies ou générées.
  • Propriétaire ou responsable : l'entité ou la personne responsable de la gestion ou de la maintenance des données.
  • Historique des modifications : un historique des modifications apportées aux données au fil du temps, y compris les dates de création, de modification et de suppression.
  • Usage et contexte d'utilisation : des informations sur la manière dont les données sont utilisées dans le système ou dans les processus métier.
  • Sécurité et confidentialité : des spécifications sur les niveaux d'accès et les autorisations nécessaires pour consulter ou modifier les données, en particulier pour les données sensibles.

Cette liste est non exhaustive. En fonction des besoins spécifiques de l’organisation, des exigences du projet ou des normes sectorielles, d’autres éléments peuvent être ajoutés. 

Comment créer un dictionnaire de données ? 

La création d'un dictionnaire de données complet et fonctionnel implique plusieurs étapes importantes. Voici un guide général sur la manière de réaliser un tel document :

  • Identifier les besoins et objectifs : avant de commencer, il est essentiel de comprendre pourquoi vous avez besoin d'un dictionnaire de données et quels sont vos objectifs. Déterminez qui seront les utilisateurs du dictionnaire et quelles informations ils recherchent.
  • Définir la structure du dictionnaire : choisissez le format et la structure du dictionnaire en fonction de vos besoins spécifiques. Vous pouvez opter pour un format de document texte, une feuille de calcul, un outil de gestion des données dédié, ou même une combinaison de ces formats.
  • Identifier les éléments à inclure : faites une liste des éléments de données que vous souhaitez inclure dans le dictionnaire. Cela peut inclure les noms des données, les descriptions, les types de données, les formats, les contraintes, les relations, etc.
  • Collecter les informations : rassemblez toutes les informations nécessaires sur chaque élément de données. Cela peut impliquer des entretiens avec les parties prenantes, l'examen de la documentation existante, l'analyse des bases de données, etc.
  • Organiser et structurer les données : organisez les informations collectées de manière logique et structurée dans le dictionnaire. Déterminez comment vous allez organiser les sections, les catégories ou les chapitres pour faciliter la recherche et la navigation.
  • Développer des modèles et des conventions : développez des modèles et des conventions pour la documentation des éléments de données afin de garantir la cohérence et la clarté. Par exemple, définissez des normes pour les descriptions, les formats de date, les abréviations, etc.
  • Valider et réviser : une fois que le dictionnaire de données est créé, soumettez-le à une validation par les parties prenantes et révisez-le en fonction de leurs commentaires et de leurs suggestions.
  • Mettre à jour régulièrement : assurez-vous de maintenir le dictionnaire de données à jour en y intégrant les modifications et les évolutions des données au fil du temps. Planifiez des révisions régulières pour garantir la pertinence et l'exactitude des informations.
  • Diffuser et former : faites en sorte que le dictionnaire de données soit largement diffusé auprès des utilisateurs concernés et fournissez une formation sur son utilisation et son importance.

À noter que la création d’un Data Dictionary implique une collaboration entre plusieurs parties prenantes (Data Owner, Data Architect, Business…). Par ailleurs, cette approche favorise la sensibilisation à l'importance des données et renforce l'alignement entre les objectifs métier et les initiatives de gestion des données.

Exemples de dictionnaires de données  

Limpida vous propose quelques exemples fictifs d’entrées de dictionnaire de données. 

Exemple 1 - Entité “Client”

Exemple de dictionnaire de données pour l'entité "Client"

Notez que cet exemple est simplifié et qu'un dictionnaire de données réel peut contenir beaucoup plus d'attributs, de détails et de relations, en fonction des besoins spécifiques de l'organisation et des systèmes impliqués.

Exemple 2 - Entité “Contrôle de gestion”

Exemple de dictionnaire de données pour l'entité "Contrôle de gestion"

Ce dictionnaire de données offre une vue d'ensemble des données financières couramment utilisées par un contrôleur de gestion dans le cadre de ses activités de suivi et d'analyse financière. Chaque attribut est décrit avec son type de données, son format et son utilisation dans le contexte de la gestion financière.

Comment maintenir un dictionnaire de données à jour ? 

Maintenir un dictionnaire de données à jour est primordial pour garantir sa pertinence et son utilité continue dans la gestion des données. Voici quelques pratiques pour assurer la mise à jour régulière du dictionnaire :

  • Assigner des responsabilités claires : désignez des responsables spécifiques chargés de la maintenance et de la mise à jour du dictionnaire de données. Cela peut être un administrateur de données, un gestionnaire de projet, ou toute autre personne ayant une connaissance approfondie des données et des processus métier.
  • Établir des processus de gestion des changements : mettez en place des processus formels pour gérer les modifications apportées aux données et aux structures de données. Cela peut inclure des mécanismes de demande de changement, d'approbation et de documentation des modifications effectuées.
  • Intégrer le dictionnaire dans l’évolution de votre SI : assurez-vous que le dictionnaire de données est pris en compte lors du développement de nouveaux systèmes ou de la modification des systèmes existants. 
  • Effectuer des révisions régulières : planifiez des révisions périodiques pour vérifier son exactitude et sa pertinence. Ces révisions peuvent être effectuées à intervalles réguliers ou en réponse à des changements majeurs dans l'organisation ou les systèmes.
  • Encourager la rétroaction des utilisateurs : sollicitez régulièrement les commentaires et les suggestions des utilisateurs du dictionnaire. Ils peuvent fournir des informations précieuses sur les lacunes ou les erreurs dans la documentation existante, ainsi que sur les besoins en informations supplémentaires.
  • Documenter les modifications apportées : chaque fois qu'une modification est apportée, assurez-vous de documenter clairement la nature de la modification, la raison du changement et la date de mise à jour. Cela garantit la traçabilité et la transparence des changements effectués.
  • Fournir une formation continue : offrez une formation régulière aux utilisateurs du dictionnaire de données pour les familiariser avec son utilisation et son importance. Plus les utilisateurs sont à l'aise avec l’outil, plus ils seront susceptibles de l'utiliser correctement et de signaler les éventuels problèmes.

Data Build Tool : vers le dictionnaire de données automatisé

Data Build Tool, plus connu sous l’acronyme DBT, est un outil utilisé pour transformer des données brutes en modèles de données propres et exploitables dans des entrepôts de données.

Si cet outil ne génère pas un dictionnaire de données au sens traditionnel, il facilite la création de documentation riche et détaillée pour les ensembles de données transformées, qui peut servir de base pour un dictionnaire de données. 

Les utilisateurs peuvent documenter leurs modèles, tests, et sources de données dans le projet DBT, en utilisant le langage Markdown pour ajouter des descriptions et des métadonnées aux modèles SQL. Ces descriptions peuvent ensuite être compilées dans une documentation générée automatiquement par DBT, qui peut fonctionner comme un dictionnaire de données pour les modèles traités par DBT.

Les utilisateurs doivent cependant s'engager activement dans la rédaction de cette documentation pour tirer pleinement parti de cette fonctionnalité.

Rond violet avec fleche vers le haut