Data Mesh vs. Data Fabric : Lequel choisir ?
Nick Johnson
8 avril 2025

gouvernance données centralisée ou décentralisée ?
Faut-il centraliser la gestion des données pour un meilleur contrôle ou la décentraliser pour plus d'agilité ? La réponse n'est peut-être pas aussi simple qu'il n'y paraît.
Le tissu de données et le maillage de données offrent deux approches distinctes de la gestion et du partage des données au sein d'une entreprise. On les oppose souvent : le tissu de données met l'accent sur la centralisation de l'accès, de la gouvernance et de la sécurité des données, tandis que le maillage de données promeut un modèle plus démocratique et décentralisé.
Les deux approches visent à relever des défis communs en matière de données, notamment :
- Veiller à ce que les bonnes données parviennent aux bonnes personnes au bon moment afin de maximiser la productivité.
- Garantir l'exactitude, la cohérence et l'exhaustivité des données.
- Protéger les données sensibles contre les accès non autorisés.
Aucun des deux modèles ne constitue une solution parfaite pour la plupart des organisations, chacun ayant ses points forts et ses limites. Toutefois, il est possible de combiner des éléments des deux approches pour créer un modèle de gouvernance qui réponde au mieux aux besoins de votre entreprise.
Qu'est-ce que le Data Fabric ?
Le Data Fabric est une couche sémantique unifiée qui intègre des sources de données et des applications disparates. Elle permet de créer des pipelines de données réutilisables, de stocker les données dans un lac et de gérer les métadonnées . Cette approche améliore l'interopérabilité, rationalise l'accès aux données et centralise la sécurité et la conformité.
Cependant, une dépendance excessive à l'égard d'un paradigme d'architecture unique peut entraîner des dépendances coûteuses, une complexité accrue et des défis d'évolutivité qui empêchent l'innovation. Le concept de "plateforme de données" est un exemple pratique du concept de tissu de données, mais lorsqu'il est appliqué de manière rigide, il peut créer des goulets d'étranglement qui peuvent être difficiles à surmonter.
Qu'est-ce que le Data Mesh ?
Le maillage de données est une architecture de données décentralisée et un modèle d'exploitation qui permet à des équipes spécifiques à un domaine d'assumer la propriété de leurs données et de les traiter comme un produit. En favorisant un modèle de gouvernance fédéréeEn favorisant un modèle de gouvernance fédéré, le maillage de données adhère aux normes de politique générale de l'entreprise tout en permettant aux équipes de prendre des décisions autonomes. Ce modèle cultive une culture de la responsabilité, garantissant la qualité des données à la source.
Toutefois, l'alignement de diverses normes de gouvernance dans plusieurs domaines peut entraîner des incohérences dans les définitions des données et des risques de sécurité si elles ne sont pas gérées de manière cohérente. La bonne exécution d'une stratégie de maillage des données nécessite un cadre de gouvernance solide pour maintenir l'interopérabilité entre les équipes.
Les leçons de l'ère des "Big Data" (données massives)
Historiquement, les grandes entreprises se sont tournées vers le data fabric, les fournisseurs de cloud comme Microsoft, Amazon, Google, Snowflake et Databricks promouvant l'analyse des données big data centralisée analyse des données big data. L'entrepôt de données cloud est devenu la "source unique de vérité" désignée, destinée à normaliser et à gouverner de vastes quantités de données structurées, semi-structurées et non structurées.
Cependant, face à l'explosion des volumes de données, les équipes chargées des données ont eu du mal à maintenir la clarté et la cohérence. De nombreuses équipes se sont retrouvées sans accès à des données bien gérées, recourant à des feuilles de calcul non gérées ou s'appuyant sur les services informatiques, ce qui a entraîné des retards et une complexité supplémentaires. La promesse de l'analyse des données big data s'est transformée en un flot de données désordonnées et ingérables.
L'approche hybride est-elle l'avenir ?
Pour relever les défis du big data, les organisations envisagent de plus en plus une approche hybride combinant les principes du data fabric et du data mesh. Selon l'étude de Gartner sur l'évolution de la gestion des données en 2024, 22 % des organisations ont mis en œuvre le data fabric, 26 % ont adopté le data mesh et 13 % utilisent déjà les deux.1 Le nombre d'organisations qui adoptent une approche hybride devrait augmenter au cours des prochaines années.
Une approche hybride exploite les forces complémentaires du tissu de données et du maillage de données. Gartner prédit : D'ici 2028, 80 % des produits de données autonomes prenant en charge les cas d'utilisation des "données prêtes pour l'IA" émergeront d'une architecture complémentaire de type "fabric" et "mesh".2 Dans ce cas, le data fabric sert d'infrastructure de base pour la gestion des données , tandis que le data mesh fournit le cadre de livraison pour les produits de données de haute qualité.
L'importance d'une approche hybride
Un modèle hybride assure une gestion des données solide gestion des données données en unifiant la conception et la gouvernance données (tissu de données) tout en maintenant l'agilité et le contexte spécifique au domaine (maillage de données). Cette approche transforme les équipes centrales de données de gardiens en médiateurs qui support équipes spécifiques au domaine dans le maintien de la qualité et de la cohérence données. La gouvernance centralisée établit des normes à l'échelle de l'entreprise, tandis que l'autonomie fédérée garantit que l'expertise du domaine façonne efficacement l'utilisation des données.
La collaboration interfonctionnelle reste essentielle dans une architecture de données hybride. Les organisations doivent trouver un équilibre entre les principes de gouvernance centralisée et les connaissances spécifiques à un domaine pour s'assurer que les produits de données restent identifiables, fiables et faciles d'accès.
Choisir la bonne approche
Le choix de la stratégie de gouvernance données de votre organisation doit tenir compte de facteurs tels que la taille de l'entreprise, la diversité et la complexité des sources de données, la structure des services et les exigences réglementaires.
De nombreuses entreprises en croissance réussissent à mettre en œuvre une gouvernance centralisée dans un premier temps, puis à étendre les principes à des domaines spécifiques. Cependant, certaines grandes entreprises complexes peuvent avoir besoin de collaborer initialement avec des équipes de domaine pour établir efficacement des normes de gouvernance , compte tenu des volumes de données existants et de la complexité.
En fin de compte, l'approche hybride est l'état final souhaité, offrant la flexibilité et le contrôle nécessaires pour exploiter vos données et fonctionner de manière optimale.
1 2024 Enquête Gartner sur l'évolution de la gestion des données , Gartner, 2024
2 How Data Leaders can Settle the Data Fabric and Mesh Debate (Comment les leaders de la gestion des données peuvent régler le débat sur le Data Fabric et le Mesh), Gartner, 2025
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.