Intelligence des données

7 mensonges sur les catalogues de données #5 : Ce n'est pas une solution de modélisation d'entreprise

Actian Corporation

9 juillet 2021

un catalogue de données n'est pas une solution de modélisation d'entreprise

Le marché du catalogue de données s'est développé rapidement, et il est désormais considéré comme essentiel dans le déploiement d'une stratégie axée sur les données. Victime de son succès, ce marché a attiré de nombreux acteurs des marchés adjacents.

 Ces acteurs ont modifié leur positionnement marketing pour se présenter comme des solutions de catalogue de données .

La réalité est que, bien que relativement faibles sur les fonctionnalités du catalogue de données elles-mêmes, ces entreprises tentent de convaincre, avec un succès proportionnel à leur budget marketing, qu'un catalogue de données n'est pas seulement un outil de recherche de de haute performance pour les équipes de données, mais une solution intégrée susceptible d'aborder une foule d'autres sujets.

L'objectif de cette série de blogs est de déconstruire l'argumentaire de ces vendeurs de catalogue de données la dernière heure.

Un catalogue de données n'est PAS une solution de modélisation d'entreprise

Certaines organisations, généralement de grande taille, ont investi pendant des années dans la modélisation de leurs processus opérationnels et de l'architecture de l'information.

Ils ont développé plusieurs couches de modèles (conceptuels, logiques, physiques) et ont mis en place une organisation qui facilite la maintenance et le partage de ces modèles avec des populations spécifiques (experts métier et informaticiens principalement).

Nous ne remettons pas en cause la valeur de ces modèles. Ils jouent un rôle clé dans l'urbanisation, les schémas, la gestion des SI, ainsi que dans la conformité réglementaire. Mais nous doutons sérieusement que ces outils de modélisation puissent fournir un catalogue de données décent.

Il s'agit également d'un phénomène de marché : certains acteurs historiques de la modélisation d'entreprise cherchent à élargir le périmètre de leur offre en se positionnant sur le marché du catalogue de données . En effet, ils gèrent déjà de nombreuses informations sur l'architecture physique, les classifications métiers, les glossaires, les ontologies, le lignage de l'information, les processus et les rôles, etc. Mais nous pouvons identifier deux défauts majeurs dans leur approche.

La première est organique. Par nature, les outils de modélisation produisent des modèles descendants pour décrire les informations contenues dans un SI. Aussi précis soit-il, un modèle reste un modèle : une représentation simplifiée de la réalité.

Ce sont des outils de communication très utiles dans une variété de domaines, mais ils ne reflètent pas exactement la réalité opérationnelle quotidienne qui, pour moi, est cruciale pour tenir les promesses d'un catalogue de données (permettre aux équipes de trouver des données, comprendre et savoir comment utiliser les ensembles de données).

Le deuxième défaut est qu'il n'est pas convivial : Il n'est pas convivial.

Un outil de modélisation est complexe et manipule un nombre important de concepts abstraits qui nécessitent une courbe d'apprentissage importante. C'est un outil pour les experts.

Nous pourrions envisager d'améliorer la convivialité, bien sûr, pour l utilisateur ouvrir à un public plus large. Mais la complexité intrinsèque de l'information ne disparaîtra pas.

La compréhension des informations fournies par ces outils nécessite une solide connaissance des principes de modélisation (classes d'objets, niveaux logiques, nomenclatures, etc.) C'est un véritable défi pour les équipes chargées des données et un défi qui semble difficile à justifier d'un point de vue opérationnel.

En réalité, les outils de modélisation qui ont été transformés en catalogues de données sont confrontés à d'importants problèmes d'adoption par les équipes (elles doivent faire d'énormes efforts pour apprendre à utiliser l'outil, pour finalement ne pas trouver ce qu'elles recherchent).

Un client potentiel nous a récemment présenté un métamodèle qu'il avait construit et nous a demandé s'il était possible de l'implémenter dans Zeenea. Dérivé de leurs modèles d'entreprise, le métamodèle comportait plusieurs dizaines de classes d'objets et des milliers d'attributs. A leur question, la réponse officielle était oui (le métamodèle Zeenea est très flexible). Mais nous avons plutôt essayé de les dissuader de s'engager dans cette voie : Un métamodèle aussi sophistiqué risquait, selon nous, de perdre les utilisateurs finaux, et de faire échouer le projet de catalogue de données ...

Faut-il pour autant abandonner les modèles d'entreprise lors de la mise en place d'un catalogue de données ? Absolument pas.

Il convient toutefois de rappeler que les modèles d'entreprise sont là pour traiter certaines questions, et le catalogue de données autres questions. Certaines informations contenues dans les modèles permettent de structurer le catalogue et d'enrichir son contenu de manière très utile (par exemple les responsabilités, les classifications, et bien sûr les glossaires commerciaux).

La meilleure approche est donc, à notre avis, de concevoir le métamodèle de catalogue en se concentrant exclusivement sur la valeur ajoutée pour les équipes de données (toujours avec la même question sous-jacente : cette information aide-t-elle à trouver, localiser, comprendre et utiliser correctement les données ?), puis d'intégrer l'outil de modélisation et le catalogue de données afin d'automatiser la fourniture de certains éléments du métamodèle déjà présents dans le modèle d'entreprise.

À emporter

 Aussi utiles et complets qu'ils puissent être, les modèles d'entreprise restent des modèles : ils ne reflètent qu'imparfaitement la réalité opérationnelle des systèmes et peinent donc à fournir un catalogue de données utile.

Les outils de modélisation, ainsi que les modèles d'entreprise, sont trop complexes et trop abstraits pour être adoptés par les équipes chargées des données. Nous vous recommandons de définir le métamodèle de votre catalogue en vue de répondre aux questions des équipes de données et de fournir certains aspects du métamodèle avec le modèle d'entreprise.

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.