Etape 1 : Identification des exigences d'un processus métier

Sélectionnez le processus métier pour lequel le modèle dimensionnel doit être conçu. En fonction de la sélection, des exigences sont formulées pour le processus métier. Un processus métier requiert plusieurs modèles dimensionnels.

Dans la modélisation dimensionnelle, la meilleure unité d'analyse est le processus métier qui présente le plus grand intérêt pour l'entreprise. Un processus métier est un ensemble d'activités connexes. Les processus métier sont classés par domaine, en fonction de l'intérêt qu'ils présentent pour l'entreprise. Lorsque vous établissez une liste de processus métier à fort potentiel, vous devez définir la priorité des exigences. Par exemple, les clients, les bénéfices, les ventes, les entreprises et les produits peuvent être des processus métier.

Les processus métier ne sont pas toujours les services de l'entreprise. Par exemple, examinons un scénario dans lequel les services Ventes et Marketing accèdent aux données des commandes. Dans ce cas, vous allez créer un seul modèle dimensionnel pour traiter les données des commandes au lieu de créer des modèles dimensionnels distincts pour les services Ventes et Marketing. Si vous créez des modèles dimensionnels en fonction des services, vous stockez plusieurs fois les mêmes données. La duplication, ou la redondance des données, risque d'altérer fortement la cohérence et la qualité des données.

Lorsque vous sélectionnez un processus métier (parmi tous les processus possibles existant dans une entreprise), vous devez définir la priorité des processus métier en fonction de certains critères. Les critères peuvent inclure l'importance des processus métier, la qualité des données des systèmes source, ainsi que la faisabilité et la complexité des processus métier.

Lorsque vous identifiez les processus métier d'un modèle dimensionnel, vous collectez les métadonnées suivantes :
Les modèles dimensionnels sont généralement utilisés dans deux environnements : l'entrepôt de données et les systèmes OLTP.
Entrepôt de données et modèle dimensionnel
Lorsque vous répartissez les données dans un entrepôt de données, vous les organisez en fonction de leur domaine. Un entrepôt de données est une structure orientée sujet. Il inclut des domaines spécifiques, sélectionnés dans l'entreprise, tels que le client et le produit. Pour assurer la mise en oeuvre d'un entrepôt de données, les données les plus importantes sont stockées dans un processus métier spécifique. Cette exigence est très différente des exigences liées aux systèmes OLTP.

Les requêtes effectuées dans l'environnement de l'entrepôt de données sont d'une nature plus stratégique et représentent des questions d'une portée plus large. Un exemple de requête peut être "Quels produits se vendent bien ?" ou "Où sont situées les agences les moins performantes ?". Pour répondre à ces requêtes, l'entrepôt de données est structuré et orienté en fonction de domaines, tels que le produit ou l'organisation. Ces domaines représentent l'unité commune de partitionnement logique dans l'entrepôt de données.

Systèmes OLTP et modèle dimensionnel
Dans l'environnement opérationnel, vous répartissez les données par application ou fonction car l'environnement repose sur des applications orientées transactions qui exécutent un ensemble de fonctions spécifique. L'objectif de l'environnement opérationnel est d'exécuter ces fonctions le plus rapidement possible. Si des requêtes sont traitées dans l'environnement opérationnel, elles sont de nature plus tactique et doivent répondre aux questions liées à ce moment précis. Une requête peut être la question "Le chèque de M. Gauthier a-t-il été traité ?"

Création et examen de la liste des processus métier de l'entreprise

Créez une liste de processus métier exhaustive applicable à l'ensemble de l'entreprise. Tenez compte des facteurs d'évaluation suivants lorsque vous établissez la liste :
Conseil : Il peut être pertinent d'affecter des valeurs à chaque facteur d'évaluation et processus métier. Lorsque vous affectez des valeurs, vous pouvez déterminer la priorité de chaque processus métier.

Identification du processus métier que vous souhaitez modéliser

Définissez les priorités des processus métier. Lorsque vous élaborez un modèle dimensionnel, vous devez identifier les processus les plus réalisables et les moins réalisables. Cette étape récapitule les facteurs d'évaluation que vous avez identifiés plus haut. Les processus les plus importants pour l'entreprise doivent être modélisés en premier.

Identification des entités et des mesures de niveau supérieur communes à plusieurs processus

Identifiez les entités métier de niveau supérieur impliquées dans chaque processus. Identifiez les entités communes à plusieurs processus métier. Une fois que les entités communes sont identifiées, vous pouvez relier les processus métier via ces dimensions communes (partagées).

Pour créer des dimensions partagées qui sont utilisées dans l'ensemble de l'entreprise, vous devez vous assurer que les différents acteurs de l'entreprise ont la même définition de ces entités communes. Cette procédure peut prendre un certain temps car les définitions d'entités communes peuvent varier d'un service de l'entreprise à l'autre. Il est nécessaire de définir les entités communes à un stade précoce car la modification ultérieure de ces définitions risque d'avoir une incidence sur les applications existantes.

Un entrepôt de données doit fournir des informations cohérentes pour les requêtes qui demandent des informations similaires. L'une des méthodes préconisée pour maintenir la cohérence des données consiste à créer des tables de dimensions partagées et utilisées par toutes les applications et les magasins de données (modèles dimensionnels) de l'entrepôt de données. Les dimensions partagées peuvent être, par exemple, des clients, une période, des produits et des dimensions géographiques, telles que la dimension Magasin.

Le développement d'un ensemble de dimensions partagées représente un défi de taille. Les dimensions communes aux processus métier doivent représenter les informations de dimension de la même manière. Cela signifie que les informations et les données sous-jacentes doivent être partagées. Chaque processus métier possède généralement son propre schéma qui contient une table de faits, plusieurs tables de dimensions partagées et des tables de dimensions uniques propres à la fonction métier.

Identification des sources de données

Identifiez les sources de données utilisées dans les processus métier. Un modèle dimensionnel est créé à partir de l'une des sources suivantes :
  • Un entrepôt de données applicable à l'ensemble de l'entreprise
  • Des systèmes source OLTP (dans le cas d'architectures de magasins de données indépendants ou dépendants)
  • Des magasins de données indépendants (dans ce cas, il peut être intéressant de regrouper des magasins de données indépendants dans un autre magasin de données ou entrepôt de données.)

Sélection de la méthode de formulation des exigences

Il est généralement difficile de définir des exigences. En général, c'est seulement après avoir vu le résultat que vous pouvez déterminer s'il répond ou pas à une exigence. Par ailleurs, les exigences d'une entreprise évoluent avec le temps. Ce qui paraît valable un jour peut ne plus l'être le lendemain. Malgré cela, vous allez utiliser les exigences identifiées à ce stade du cycle de développement pour concevoir un modèle dimensionnel.

Les questions à prendre en compte sont les suivantes :
  • Comment construire quelque chose qui ne peut pas être défini avec précision ?
  • Comment savoir si les exigences ont été correctement identifiées ?
Bien qu'il n'y ait pas de test définitif, vous pouvez généralement commencer le processus de modélisation si les exigences répondent aux questions suivantes :
Pour formuler l'ensemble des exigences, vous devez examiner les questions suivantes :
  • Qui sont les personnes, les groupes ou les entreprises concernés ?
  • Quelles fonctions doivent être analysées ?
  • Pourquoi les données sont-elles nécessaires ?
  • Quand les données doivent-elles être enregistrées ?
  • Où s'exécutent les processus importants (zone géographique et organisation) ?
  • Comment les performances des fonctions doivent-elles être mesurées ?
  • Comment sont mesurées les performances du processus métier ? Quels sont les facteurs déterminants dans la réussite ou l'échec ?
  • Quelle est la méthode de distribution des informations ? S'agit-il d'un rapport de données, d'un document papier, d'un message électronique ou d'une autre méthode ?
  • Quels types d'informations manquent pour effectuer l'analyse et la prise de décision ?
  • Quelles mesures sont actuellement prises pour palier ce manque d'informations ?
  • Quel niveau de détail permettrait d'effectuer une analyse des données ?
En général, la plupart des méthodes d'identification des exigences métier s'appuient sur deux approches : les sources et les utilisateurs.
Formulation des exigences gérée par les sources
La formulation des exigences gérée par les sources repose sur la définition des exigences à l'aide des données source disponibles dans des systèmes de production opérationnels. Vous pouvez définir les exigences en analysant un modèle de données source ou en examinant la disposition des enregistrements physiques réels et en sélectionnant les données qui présentent un intérêt.

Le principal avantage de cette méthode est l'assurance de pouvoir fournir toutes les données car vous vous limitez dès le début aux éléments disponibles. Le second avantage est la réduction du temps consacré aux utilisateurs lors des premières phases du projet. Toutefois, rien ne peut remplacer l'implication des utilisateurs.

Cette méthode peut également présenter des inconvénients :
  • En limitant l'implication de l'utilisateur, vous augmentez le risque d'établir un ensemble d'exigences incorrect.
  • En fonction du volume de données source que vous possédez et de la disponibilité des modèles source utilisés pour ces données, cette méthode peut prendre énormément de temps.
  • Certains utilisateurs peuvent avoir besoin d'accéder à des données actuellement indisponibles.
Sans une identification de l'ensemble des exigences, vous ne serez pas en mesure d'analyser les éléments nécessaires pour obtenir des données externes. Les données externes sont les données qui se trouvent en dehors de l'entreprise. Elles peuvent être d'une grande importance pour les utilisateurs.
Le résultat de la méthode gérée par source est de fournir les données que vous possédez déjà, ce qui est pertinent dans au moins deux cas :
  • Cette méthode peut être utilisée pour élaborer une liste relativement complète des principales dimensions qui présentent un intérêt pour l'entreprise. Si vous envisagez de créer un entrepôt de données à l'échelle de l'entreprise, elle permet de limiter la multiplication des dimensions en double dans des magasins de données développés séparément.
  • L'analyse des relations dans une source de données permet d'identifier les domaines sur lesquels doivent porter les efforts de développement de l'entrepôt de données.
Formulation des exigences gérée par les utilisateurs
La formulation des exigences gérée par les utilisateurs est une méthode reposant sur la définition des exigences via l'examen des fonctions exécutées par les utilisateurs. Cette méthode est généralement mise en oeuvre en organisant une série de réunions ou d'entretiens avec des utilisateurs.

Le principal avantage de cette méthode est la concentration des efforts vers les éléments réellement nécessaires plutôt que vers les éléments disponibles. En général, cette méthode a une portée plus limitée que la méthode gérée par les sources. La méthode gérée par l'utilisateur crée généralement un entrepôt de données ou un magasin de données opérationnel dans un délai plus court.

Toutefois, les attentes formulées doivent être examinées de près. Les utilisateurs doivent bien comprendre que certaines des données dont ils ont besoin ne peuvent pas être accessibles pour différentes raisons. Toutefois, vous ne devez pas limiter les demandes formulées par l'utilisateur. Les idées alternatives doivent être encouragées lorsque vous définissez les exigences applicables à un entrepôt de données. Cette méthode vous empêche d'écarter des exigences simplement parce qu'elles ne vous semblent pas réalisables. Si un utilisateur limite ses exigences, vous risquez de laisser passer des données pertinentes disponibles dans les systèmes de production.

La formulation des exigences gérée par l'utilisateur est généralement la méthode préconisée, en particulier pour le développement de magasins de données indépendants ou l'insertion de données dans des magasins de données à partir d'un entrepôt utilisé dans l'ensemble de l'entreprise.

Formulation des exigences

Lors de la formulation des exigences, les besoins des utilisateurs sont collectés et documentés. Vous examinez les processus métier et les activités d'analyse des informations dans lesquels les utilisateurs sont impliqués. Un utilisateur doit généralement évaluer ou analyser certains aspects de l'activité. Concentrez vos efforts sur l'identification des deux principaux éléments d'analyse auxquels les utilisateurs sont confrontés au quotidien :
Lors de la formulation des exigences, vous devez chercher à comprendre la zone problématique pour laquelle la modélisation est effectuée. En règle générale, les exigences formulées à ce stade sont décrites de manière informelle et les schémas ne sont pas détaillés de manière exhaustive. Lors de la formulation de ces exigences, identifiez les domaines suivants :
  • Identifiez les questions les plus importantes que l'entreprise doit prendre en considération. Vous pouvez affecter des valeurs de priorité à chaque question pour déterminer les questions les plus importantes à traiter.
  • Déterminez comment l'entreprise souhaite enregistrer les données au fur et à mesure de leur évolution. Par exemple, vous souhaitez savoir comment sont gérées les données d'historique des produits qui ne sont plus commercialisés ou les dossiers des employés.

Analyse des exigences

Analysez les exigences de l'entreprise. Identifiez les exigences informelles et définissez des mesures et des entités de niveau supérieur. Ces objets pourront devenir des dimensions lors de la modélisation des données. Utilisez ce premier travail comme point de départ pour filtrer les entités et les mesures. Vous pouvez commencer à esquisser la structure des exigences, les dimensions, les hiérarchies et les mesures pour chaque partie du modèle de données.

Récapitulatif de l'analyse des processus métier

Créez un rapport à partir de l'analyse. Le rapport doit contenir les informations suivantes :

Commentaires en retour