La modélisation des données est la pratique qui consiste à créer une représentation visuelle des éléments et des flux de données dans le contexte d'un processus d'entreprise. Les modèles de données sont créés pour documenter la façon dont les données sont structurées pour support un processus commercial. Ils peuvent être élaborés à partir de schémas de base de données existants afin de support efforts de réingénierie.
Pourquoi modéliser les données ?
Les modèles de données constituent une méthode de meilleure pratique pour créer une conception de base. La représentation visuelle aide à documenter et à communiquer la conception avec les réviseurs et les collaborateurs. Elle est utile lorsqu'un système doit être amélioré pour être étendu, et elle est essentielle lors de la refonte d'une application pour utiliser une architecture de microservices.
Types de modèles de données
Il existe de multiples façons de modéliser les données. En voici quelques exemples :
- Le diagramme Entité-Relation (ER) est le modèle le plus courant. Il montre comment différents objets représentant des entités sont reliés entre eux à l'aide de lignes.
- Un modèle orienté objet permet de montrer les connexions entre les objets à stocker dans une base de données orientée objet.
- Un modèle relationnel montre comment les tables sont liées par des clés dans un schéma de base de données relationnelle.
- Un modèle de données dimensionnel est utile lors de la conception d'un schéma en étoile pour un entrepôt de données.
- Un modèle de données en réseau peut montrer comment les données enregistrement sont structurées et connectées.
- Un modèle de graphe peut décrire les connexions entre les nœuds d'une base de données graphique.
Les trois niveaux de la modélisation des données
Selon le stade de modélisation auquel elle se trouve, une entreprise peut avantage des trois niveaux pour articuler les relations entre les données :
- Au début d'un projet, il est utile de définir à un haut niveau les données qui seront utilisées pour support un processus d'entreprise. Le modèle conceptuel de données fournit une vue d'ensemble des processus utilisés pour faire fonctionner le processus de gestion. Les détails sont omis à ce niveau afin de faciliter la transmission des concepts.
- La plupart des modèles commencent par le modèle logique de données du processus métier à mettre en œuvre. Ce modèle détaille toutes les entités, leurs attributs et les relations entre elles. Les relations de clé primaire sont mises en évidence, ainsi que les relations de clé étrangère. Un analyste commercial rédige ce modèle de données.
- Le niveau le plus bas est le modèle de données physiquequi contient suffisamment de détails pour créer un schéma de base de données. Un concepteur de base de données ou un développeur d'applications dessinerait ce niveau de modèle de données. Le modèle physique peut correspondre à un schéma approprié à la technologie de la base de données. Pour une base de données relationnelle, le modèle physique peut dé-normaliser un modèle de données logique afin d'optimiser les performances pour les questions les plus utilisées auxquelles la base de données doit répondre. Les types de schémas pris en charge par une conception physique comprennent SQL, NoSQL et JSON.
Modélisation des multiplicités
Les relations entre les entités peuvent être représentées de différentes manières. Les types généraux de relations cartographiées sont les suivants
- Zéro, un ou relation facultative.
- Relation de personne à personne.
- Zéro ou plusieurs relations.
- Une ou plusieurs relations.
- Une relation à portée limitée.
Notations de modélisation des données
Les concepteurs ont le choix entre plusieurs styles de notation pour dessiner les modèles. Voici quelques-uns des styles les plus courants :
- La notation IE est un style propre pour les modèles de données de haut niveau. Elle est simple car elle omet les détails des attributs.
- La notation de Barker peut être utilisée à plusieurs niveaux. Elle est plus détaillée que la notation IE.
- La notation IDEF1X est bien adaptée à la conception de bases de données physiques, mais elle n'est plus très répandue.
- L'Object Management Group (OMG) a proposé une norme de modélisation appelée Universal Modeling Language (UML). Cette norme est encore à l'état de projet jusqu'à ce qu'elle soit ratifiée.
Construction d'un modèle
La construction d'un modèle comprend plusieurs étapes et peut être laborieuse. L'avantage passer par ces étapes est de développer une compréhension approfondie des données et de leurs interrelations, ce qui vous aidera à créer de meilleures applications. Les étapes les plus courantes sont, dans l'ordre, les suivantes :
- Comprendre les cas d'utilisation ou les processus d'entreprise que le modèle support.
- Créer un modèle conceptuel.
- Comprendre les volumes de données et les questions auxquelles la base de données doit répondre.
- Créer le modèle logique de données et en valider l'exhaustivité et l'exactitude.
- Décidez du modèle de base de données le mieux adapté à l'application, par exemple SQL, NoSQL ou JSON.
- Normaliser, réduire les doublons et dé-normaliser pour améliorer les performances.
- Créer un modèle de base de données physique.
- Créer le schéma de la base de données.
- Charger les données de test et écrire des requêtes.
- Valider les résultats de la requête .
- Déployer le modèle.
Modélisation des données avec Actian Solutions
La plateforme de données Actian prend en charge les schémas de base de données SQL et les données JSON. Actian Zen peut être utilisé pour déployer des schémas de base de données SQL et NoSQL. Visitez le site Web d'Actian pour découvrir comment nos solutions aident les gens à connecter, gérer et analyser les données.