7 mensonges des fournisseurs de catalogue de données #1 : Ce n'est pas une solution de gouvernance données
Actian Corporation
16 juin 2021

Le marché du catalogue de données s'est développé rapidement, et il est désormais considéré comme essentiel dans le déploiement d'une stratégie axée sur les données. Victime de son succès, ce marché a attiré de nombreux acteurs des marchés adjacents.
Ces acteurs ont modifié leur positionnement marketing pour se présenter comme des solutions de catalogue de données .
La réalité est que, bien que relativement faibles sur les fonctionnalités du catalogue de données elles-mêmes, ces entreprises tentent de convaincre, avec un succès proportionnel à leur budget marketing, qu'un catalogue de données n'est pas seulement un outil de recherche de de haute performance pour les équipes de données, mais une solution intégrée susceptible d'aborder une foule d'autres sujets.
L'objectif de cette série de blogs est de déconstruire l'argumentaire de ces vendeurs de catalogue de données la dernière heure.
Voici, selon nous, les 7 mensonges des vendeurs de catalogue de données :
- Un catalogue de données est une plateforme de gouvernance données.
- Un catalogue de données permet de mesurer et de gérer la qualité des données.
- Un catalogue de données permet de gérer la conformité réglementaire.
- Un catalogue de données peut requête données directement.
- Un catalogue de données peut modéliser l'architecture logique et les processus d'entreprise autour des données.
- Le catalogue de données est un outil collaboratif de cartographie et de gestion des métadonnées qui ne peut être automatisé.
- Un catalogue de données est un projet long, complexe et coûteux.
Un catalogue de données n'est PAS une solution de gouvernance données.
Il s'agit probablement de notre position la plus controversée sur le rôle d'un catalogue de données et la controverse trouve son origine dans les puissants messages marketing diffusés par le leader mondial de la gestion des métadonnées dont la solution est en réalité une plateforme de gouvernance données vendue comme un catalogue de données.
Pour être clair, une bonne gouvernance gouvernance données est l'un des piliers d'une stratégie efficace en la matière.
Son objectif principal est la définition des rôles, des responsabilités, des politiques de l'entreprise, des procédures, des contrôles, des comités. En un mot, sa fonction est de déployer et d'orchestrer, dans son intégralité, le contrôle interne des données dans toutes ses dimensions.
Reconnaissons que gouvernance données comporte de nombreux aspects différents (architecture de traitement et de stockage, classification, conservation, qualité, risque, conformité, innovation, etc.) et qu'il n'existe pas de modèle universel "taille unique" adapté à toutes les organisations. Comme pour les autres domaines de la gouvernance , chaque organisation doit concevoir et piloter son propre paysage en fonction de ses capacités et de ses ambitions, ainsi que d'une analyse approfondie des risques.
La mise en place d'une gouvernance efficace gouvernance données n'est pas un projet, mais plutôt un programme de transformation.
Aucune "solution" commerciale ne peut remplacer cet effort de transformation.
Quelle est la place du catalogue de données dans tout cela ?
La recherche d'un catalogue de données est généralement le résultat d'un besoin très opérationnel : Une fois le Data Lake et un certain nombre d'outils de libre-service mis en place, le défi suivant devient rapidement de savoir ce que le Data Lake contient réellement (à la fois d'un point de vue technique et sémantique), d'où viennent les données, quelles transformations les données ont pu subir, qui est en charge des données, quelles politiques internes s'appliquent aux données, qui utilise actuellement les données et pourquoi, etc.
L'incapacité à fournir ce type d'informations à l'utilisateur utilisateur peut avoir de graves conséquences pour une organisation, et un catalogue de données est le meilleur moyen d'atténuer ce risque. Lorsqu'il s'agit de choisir une solution transversale, impliquant des personnes issues de nombreux services différents, la sélection de la solution est souvent confiée aux personnes chargées de la gouvernance données, car elles semblent les mieux placées pour coordonner les attentes du plus grand nombre de parties prenantes.
C'est là que l'alchimie commence. Le catalogue de données, dont l'objectif initial était de fournir aux équipes chargées des données une solution rapide pour découvrir, explorer, comprendre et exploiter les données, devient un projet gargantuesque dans lequel tous les aspects de la gouvernance doivent être résolus.
Le projet devra :
- Gérer la qualité des données.
- Gérer les données personnelles et la conformité (GDPR en premier lieu).
- Gérer la confidentialité, la sécurité et l'accès aux données.
- Proposer un nouveau Master gestion des données (MDM).
- Assurer un lignage automatisé champ par champ pour tous les ensembles de données.
- Support tous les rôles définis dans le système de gouvernance et permettre la configuration du flux de travail correspondant.
- Intégrer tous les modèles d'entreprise produits au cours des dix dernières années pour le programme d'urbanisation.
- Autoriser les requêtes croisées sur les sources de données tout en respectant l'habilitation des utilisateur sur ces mêmes sources, ainsi que l'anonymisation des résultats.
Certains fournisseurs parviennent à convaincre leurs clients que leur solution peut être ce guichet unique pour la gouvernance données. Si vous pensez que c'est possible, n'hésitez pas à les appeler, ils se feront un plaisir de vous aider. Mais pour être franc, chez Zeenea, nous ne croyons tout simplement pas qu'une telle plateforme soit possible, ni même souhaitable. Trop complexe, trop rigide, trop chère et trop bureaucratique, ce type de solution ne pourra jamais être adapté à une organisation centrée sur les données.
Pour nous, le catalogue de données joue un rôle clé dans un programme de gouvernance données. Ce rôle ne doit pas consister à prendre en charge tous les aspects de la gouvernance , mais plutôt à faciliter la communication et la sensibilisation aux règles de gouvernance au sein de l'entreprise et à aider chaque partie prenante à devenir un élément actif de cette gouvernance.
Selon nous, un catalogue de données est l'un des composants qui offre le plus grand retour sur investissement dans les organisations centrées sur les données qui s'appuient sur des lacs de données avec des pipelines de données modernes... à condition qu'il puisse être déployé rapidement et qu'il soit associé à un prix raisonnable.
À emporter
Un catalogue de données n'est pas une plateforme de gestion de la gouvernance données.
La gouvernance données est essentiellement un programme de transformation comportant de multiples couches qui ne peuvent être traitées par une solution unique. Dans une organisation centrée sur les données, la meilleure façon de commencer, d'apprendre, d'éduquer et de rester agile est de combiner des directives de gouvernance claires avec un catalogue de données moderne qui peut partager ces directives avec les utilisateurs finaux.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.