Conception d’entrepôts de données

But de la formation

Modéliser un entrepôt de données structuré, performant et évolutif venant appuyer efficacement les gestionnaires dans la prise de décisions stratégiques et opérationnelles au sein de toute organisation.

Description

De nos jours, de plus en plus d’organisations s’affairent à mesurer et améliorer leurs processus d’affaires au moyen de l’informatique décisionnelle (BI) avec comme concept central l’entrepôt de données.

Objectifs

- Expliquer les concepts de l’informatique décisionnelle (BI) supportés par les entrepôts de données.
- Mettre en pratique les techniques de base en modélisation dimensionnelle.
- Reconnaître les situations complexes à modéliser et les pièges à éviter.
- Utiliser les techniques permettant de modéliser les situations complexes.
- Concevoir une structure d’entrepôt de données complète, optimale et évolutive.

Méthodologie

Exposé interactif (70%), exercice (30%)

Clientèle visée

Professionnel et technicien spécialisés en TI

Contenu

Entrepôts de données

  • Système transactionnel versus système décisionnel
  • Modélisation dimensionnelle
  • Fait et dimension
  • Modèle relationnel versus modèle dimensionnel
  • Schéma en étoile (Star Schema)

Modélisation des faits

  • Tables de faits et processus d’affaires
  • Table de faits de type 'transactions'
  • Additivité
  • 'Grain'
  • 'Sparsity' (données clairsemées)
  • Techniques à éviter (et bonnes pratiques à utiliser) : modèle en flocon, faits désynchronisés, faits avec différents niveaux de détails (grain)
  • Dimensions conformes

Modélisation des dimensions

  • Surrogate Key
  • Regroupement des attributs de dimension
  • Modélisation des dimensions temporelles
  • Techniques d'enrichissement des dimensions
  • Dimensions à évolution lente (Slowly Changing Dimensions - SCD types 1 et 2)
  • Dimensions horodatées (time-stamped)

Cas particuliers en modélisation des dimensions

  • Dimensions dégénérées
  • Découpage des dimensions de grande taille
  • Utilisation des mini-dimensions
  • Alias de dimensions
  • Valeur NULL dans les attributs de dimension
  • Dimensions comportementales
  • Hiérarchies d’attributs à l’intérieur d’une dimension
  • Dimensions à multiples valeurs

Cas particuliers en modélisation des faits

  • Table de faits 'snapshots périodiques'
  • Table de faits 'snapshots cumulatifs'
  • Table de faits sans faits (factless)
  • Modélisation de taux
  • Modélisation de valeurs-cible
Marc Messier

Marc Messier