7 mensonges sur les catalogues de données #5 : Ce n'est pas une solution de modélisation d'entreprise
Actian Corporation
9 juillet 2021

Le marché du catalogue de données s'est développé rapidement, et il est désormais considéré comme essentiel dans le déploiement d'une stratégie axée sur les données. Victime de son succès, ce marché a attiré de nombreux acteurs des marchés adjacents.
Ces acteurs ont modifié leur positionnement marketing pour se présenter comme des solutions de catalogue de données .
La réalité est que, bien que relativement faibles sur les fonctionnalités du catalogue de données elles-mêmes, ces entreprises tentent de convaincre, avec un succès proportionnel à leur budget marketing, qu'un catalogue de données n'est pas seulement un outil de recherche de de haute performance pour les équipes de données, mais une solution intégrée susceptible d'aborder une foule d'autres sujets.
L'objectif de cette série de blogs est de déconstruire l'argumentaire de ces vendeurs de catalogue de données la dernière heure.
Voici, selon nous, les 7 mensonges des vendeurs de catalogue de données :
- Un catalogue de données est une plateforme de gouvernance données.
- Un catalogue de données permet de mesurer et de gérer la qualité des données.
- Un catalogue de données permet de gérer la conformité réglementaire.
- Un catalogue de données peut requête données directement.
- Un catalogue de données peut modéliser l'architecture logique et les processus d'entreprise autour des données.
- Le catalogue de données est un outil collaboratif de cartographie et de gestion des métadonnées qui ne peut être automatisé.
- Un catalogue de données est un projet long, complexe et coûteux.
Un catalogue de données n'est PAS une solution de modélisation d'entreprise
Certaines organisations, généralement de grande taille, ont investi pendant des années dans la modélisation de leurs processus opérationnels et de l'architecture de l'information.
Ils ont développé plusieurs couches de modèles (conceptuels, logiques, physiques) et ont mis en place une organisation qui facilite la maintenance et le partage de ces modèles avec des populations spécifiques (experts métier et informaticiens principalement).
Nous ne remettons pas en cause la valeur de ces modèles. Ils jouent un rôle clé dans l'urbanisation, les schémas, la gestion des SI, ainsi que dans la conformité réglementaire. Mais nous doutons sérieusement que ces outils de modélisation puissent fournir un catalogue de données décent.
Il s'agit également d'un phénomène de marché : certains acteurs historiques de la modélisation d'entreprise cherchent à élargir le périmètre de leur offre en se positionnant sur le marché du catalogue de données . En effet, ils gèrent déjà de nombreuses informations sur l'architecture physique, les classifications métiers, les glossaires, les ontologies, le lignage de l'information, les processus et les rôles, etc. Mais nous pouvons identifier deux défauts majeurs dans leur approche.
La première est organique. Par nature, les outils de modélisation produisent des modèles descendants pour décrire les informations contenues dans un SI. Aussi précis soit-il, un modèle reste un modèle : une représentation simplifiée de la réalité.
Ce sont des outils de communication très utiles dans une variété de domaines, mais ils ne reflètent pas exactement la réalité opérationnelle quotidienne qui, pour moi, est cruciale pour tenir les promesses d'un catalogue de données (permettre aux équipes de trouver des données, comprendre et savoir comment utiliser les ensembles de données).
Le deuxième défaut est qu'il n'est pas convivial : Il n'est pas convivial.
Un outil de modélisation est complexe et manipule un nombre important de concepts abstraits qui nécessitent une courbe d'apprentissage importante. C'est un outil pour les experts.
Nous pourrions envisager d'améliorer la convivialité, bien sûr, pour l utilisateur ouvrir à un public plus large. Mais la complexité intrinsèque de l'information ne disparaîtra pas.
La compréhension des informations fournies par ces outils nécessite une solide connaissance des principes de modélisation (classes d'objets, niveaux logiques, nomenclatures, etc.) C'est un véritable défi pour les équipes chargées des données et un défi qui semble difficile à justifier d'un point de vue opérationnel.
En réalité, les outils de modélisation qui ont été transformés en catalogues de données sont confrontés à d'importants problèmes d'adoption par les équipes (elles doivent faire d'énormes efforts pour apprendre à utiliser l'outil, pour finalement ne pas trouver ce qu'elles recherchent).
Un client potentiel nous a récemment présenté un métamodèle qu'il avait construit et nous a demandé s'il était possible de l'implémenter dans Zeenea. Dérivé de leurs modèles d'entreprise, le métamodèle comportait plusieurs dizaines de classes d'objets et des milliers d'attributs. A leur question, la réponse officielle était oui (le métamodèle Zeenea est très flexible). Mais nous avons plutôt essayé de les dissuader de s'engager dans cette voie : Un métamodèle aussi sophistiqué risquait, selon nous, de perdre les utilisateurs finaux, et de faire échouer le projet de catalogue de données ...
Faut-il pour autant abandonner les modèles d'entreprise lors de la mise en place d'un catalogue de données ? Absolument pas.
Il convient toutefois de rappeler que les modèles d'entreprise sont là pour traiter certaines questions, et le catalogue de données autres questions. Certaines informations contenues dans les modèles permettent de structurer le catalogue et d'enrichir son contenu de manière très utile (par exemple les responsabilités, les classifications, et bien sûr les glossaires commerciaux).
La meilleure approche est donc, à notre avis, de concevoir le métamodèle de catalogue en se concentrant exclusivement sur la valeur ajoutée pour les équipes de données (toujours avec la même question sous-jacente : cette information aide-t-elle à trouver, localiser, comprendre et utiliser correctement les données ?), puis d'intégrer l'outil de modélisation et le catalogue de données afin d'automatiser la fourniture de certains éléments du métamodèle déjà présents dans le modèle d'entreprise.
À emporter
Aussi utiles et complets qu'ils puissent être, les modèles d'entreprise restent des modèles : ils ne reflètent qu'imparfaitement la réalité opérationnelle des systèmes et peinent donc à fournir un catalogue de données utile.
Les outils de modélisation, ainsi que les modèles d'entreprise, sont trop complexes et trop abstraits pour être adoptés par les équipes chargées des données. Nous vous recommandons de définir le métamodèle de votre catalogue en vue de répondre aux questions des équipes de données et de fournir certains aspects du métamodèle avec le modèle d'entreprise.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.