Intelligence des données

7 mensonges des fournisseurs de catalogue de données #1 : Ce n'est pas une solution de gouvernance données

Actian Corporation

16 juin 2021

un catalogue de données n'est pas une solution de gouvernance

Le marché du catalogue de données s'est développé rapidement, et il est désormais considéré comme essentiel dans le déploiement d'une stratégie axée sur les données. Victime de son succès, ce marché a attiré de nombreux acteurs des marchés adjacents.

 Ces acteurs ont modifié leur positionnement marketing pour se présenter comme des solutions de catalogue de données .

La réalité est que, bien que relativement faibles sur les fonctionnalités du catalogue de données elles-mêmes, ces entreprises tentent de convaincre, avec un succès proportionnel à leur budget marketing, qu'un catalogue de données n'est pas seulement un outil de recherche de de haute performance pour les équipes de données, mais une solution intégrée susceptible d'aborder une foule d'autres sujets.

L'objectif de cette série de blogs est de déconstruire l'argumentaire de ces vendeurs de catalogue de données la dernière heure.

Un catalogue de données n'est PAS une solution de gouvernance données.

Il s'agit probablement de notre position la plus controversée sur le rôle d'un catalogue de données et la controverse trouve son origine dans les puissants messages marketing diffusés par le leader mondial de la gestion des métadonnées dont la solution est en réalité une plateforme de gouvernance données vendue comme un catalogue de données.

Pour être clair, une bonne gouvernance gouvernance données est l'un des piliers d'une stratégie efficace en la matière.

Son objectif principal est la définition des rôles, des responsabilités, des politiques de l'entreprise, des procédures, des contrôles, des comités. En un mot, sa fonction est de déployer et d'orchestrer, dans son intégralité, le contrôle interne des données dans toutes ses dimensions.

Reconnaissons que gouvernance données comporte de nombreux aspects différents (architecture de traitement et de stockage, classification, conservation, qualité, risque, conformité, innovation, etc.) et qu'il n'existe pas de modèle universel "taille unique" adapté à toutes les organisations. Comme pour les autres domaines de la gouvernance , chaque organisation doit concevoir et piloter son propre paysage en fonction de ses capacités et de ses ambitions, ainsi que d'une analyse approfondie des risques.

La mise en place d'une gouvernance efficace gouvernance données n'est pas un projet, mais plutôt un programme de transformation.

Aucune "solution" commerciale ne peut remplacer cet effort de transformation.

Quelle est la place du catalogue de données dans tout cela ?

La recherche d'un catalogue de données est généralement le résultat d'un besoin très opérationnel : Une fois le Data Lake et un certain nombre d'outils de libre-service mis en place, le défi suivant devient rapidement de savoir ce que le Data Lake contient réellement (à la fois d'un point de vue technique et sémantique), d'où viennent les données, quelles transformations les données ont pu subir, qui est en charge des données, quelles politiques internes s'appliquent aux données, qui utilise actuellement les données et pourquoi, etc.

L'incapacité à fournir ce type d'informations à l'utilisateur utilisateur peut avoir de graves conséquences pour une organisation, et un catalogue de données est le meilleur moyen d'atténuer ce risque. Lorsqu'il s'agit de choisir une solution transversale, impliquant des personnes issues de nombreux services différents, la sélection de la solution est souvent confiée aux personnes chargées de la gouvernance données, car elles semblent les mieux placées pour coordonner les attentes du plus grand nombre de parties prenantes.

C'est là que l'alchimie commence. Le catalogue de données, dont l'objectif initial était de fournir aux équipes chargées des données une solution rapide pour découvrir, explorer, comprendre et exploiter les données, devient un projet gargantuesque dans lequel tous les aspects de la gouvernance doivent être résolus.

Le projet devra :

  • Gérer la qualité des données.
  • Gérer les données personnelles et la conformité (GDPR en premier lieu).
  • Gérer la confidentialité, la sécurité et l'accès aux données.
  • Proposer un nouveau Master gestion des données (MDM).
  • Assurer un lignage automatisé champ par champ pour tous les ensembles de données.
  • Support tous les rôles définis dans le système de gouvernance et permettre la configuration du flux de travail correspondant.
  • Intégrer tous les modèles d'entreprise produits au cours des dix dernières années pour le programme d'urbanisation.
  • Autoriser les requêtes croisées sur les sources de données tout en respectant l'habilitation des utilisateur sur ces mêmes sources, ainsi que l'anonymisation des résultats.

Certains fournisseurs parviennent à convaincre leurs clients que leur solution peut être ce guichet unique pour la gouvernance données. Si vous pensez que c'est possible, n'hésitez pas à les appeler, ils se feront un plaisir de vous aider. Mais pour être franc, chez Zeenea, nous ne croyons tout simplement pas qu'une telle plateforme soit possible, ni même souhaitable. Trop complexe, trop rigide, trop chère et trop bureaucratique, ce type de solution ne pourra jamais être adapté à une organisation centrée sur les données.

Pour nous, le catalogue de données joue un rôle clé dans un programme de gouvernance données. Ce rôle ne doit pas consister à prendre en charge tous les aspects de la gouvernance , mais plutôt à faciliter la communication et la sensibilisation aux règles de gouvernance au sein de l'entreprise et à aider chaque partie prenante à devenir un élément actif de cette gouvernance.

Selon nous, un catalogue de données est l'un des composants qui offre le plus grand retour sur investissement dans les organisations centrées sur les données qui s'appuient sur des lacs de données avec des pipelines de données modernes... à condition qu'il puisse être déployé rapidement et qu'il soit associé à un prix raisonnable.

À emporter

Un catalogue de données n'est pas une plateforme de gestion de la gouvernance données.

La gouvernance données est essentiellement un programme de transformation comportant de multiples couches qui ne peuvent être traitées par une solution unique. Dans une organisation centrée sur les données, la meilleure façon de commencer, d'apprendre, d'éduquer et de rester agile est de combiner des directives de gouvernance claires avec un catalogue de données moderne qui peut partager ces directives avec les utilisateurs finaux.

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.