métadonnées

Les données de SaaS sont plus que des formes et des graphiques sur l'image d'une femme dans la technologie

Qu'est-ce que les métadonnées?

métadonnées fournit des informations sur les données.

Pourquoi les métadonnées sont-elles importantes ?

Il fournit des informations qui aident les consommateurs à trouver, utiliser et comprendre la qualité des données et leur origine. métadonnées montre également comment les données sont liées pour fournir un contexte aux utilisateurs.

Types de métadonnées

Il peut être classé dans les catégories suivantes :

  • Les métadonnées descriptives comprennent des informations telles que l'auteur, la date de création, la date de modification et la taille.
  • Les métadonnées structurellesdécrivent la manière dont les données composées sont structurées. Par exemple, une seule chaîne de caractères peut contenir plusieurs champs, y compris des informations variables sur la longueur des champs et le type de données.
  • Les métadonnées administrativesfournissent des informations de gestion, telles que la fréquence à laquelle elles doivent être actualisées pour rester utiles.
  • Reference métadonnées enregistre des informations sur la qualité des données et la source.
  • Les métadonnées juridiquesmentionnent le détenteur des droits d'auteur, les limites d'utilisation et les exigences en matière de licence.

Comment il est utilisé

métadonnées remplit de multiples fonctions. Le catalogage des données est important car il informe les utilisateurs de leur qualité, de leur exhaustivité, de leur provenance et de leur autorité. Les images peuvent être associées à des métadonnées, notamment des signatures numériques, des dates de création, des emplacements géographiques, des tailles et des couleurs. Les données EXIF (Exchangeable Image File) sont des métadonnées standardiséesEmbarqué dans le fichier image.

Le Data Lakehouse fournit des métadonnées qui augmentent considérablement la valeur des ensembles de données qu'il maintient en documentant la qualité des données et les relations entre les différents actifs de données.

Les systèmes de gestion de bases de données la gèrent dans des catalogues de systèmes qui enregistrement nombre d'enregistrements dans une table, la cardinalité des champs de données, les points d'eau élevés et les points d'eau bas, la sélectivité des index et le regroupement des données dans les index.

Les applications web modernes utilisent des interfaces de programmation d'applications (API) pour accéder à des outils tiers et transmettre des données à l'aide de types de données métadonnées tels que JSON et XML. Les applications traditionnelles se transmettaient des données, mais celles-ci n'étaient pas auto-décrites et il n'était pas possible de les interroger pour savoir quelles données elles attendaient, contrairement à ce que l'on peut faire avec un service web moderne. Au fur et à mesure que les applications se transforment en composants afin de pouvoir être utilisées plus facilement pour créer de nouvelles applications, leur nombre augmentera, ce qui accroîtra leur besoin d'auto-documenter leurs fonctions et leurs besoins en matière de données.

Avantages des métadonnées

Le besoin de métadonnées augmente principalement en raison des avantages suivants :

  • Il accroît l'utilité des sources de données existantes.
  • Il rend les données utiles en documentant leur qualité et leur utilité.
  • Il comprend des étiquettes qui permettent de trouver les données à l'aide de moteurs de recherche.
  • Il favorise la gouvernance données en documentant les propriétaires des données ou leur absence.
  • À mesure que les volumes et les sources de données augmentent, elles deviennent de plus en plus précieuses.
  • L'utilisation des données est une bonne pratique de gestion des données qui profite au propriétaire des données et aux partenaires commerciaux qui les partagent. Le succès du partage des données dépend de bonnes métadonnées. Les données qui ne sont pas bien documentées risquent de ne pas être utilisées ou de ne pas inspirer confiance.
  • Il s'agit d'un pilier fondamental des modèles de données avancés tels que les entrepôts de données, les lacs de données et les maillages de données.
  • Il soutient le processus de découverte des documents dans le cadre des audits de conformité.
  • La visibilité obtenue en l'utilisant pour documenter les actifs de données d'une organisation est la première étape de la rationalisation de l'utilisation des données, de sorte que les données en double puissent être examinées, fusionnées ou supprimées.

Actian

La plateforme de données Actian facilite la création d'entrepôts de données de de haute performance . La base de données intégrée en colonnes et vectorisée utilise une capacité de requête parallèle supérieure pour des résultats de requête plus rapides. Les données externes peuvent être enregistrées dans l'entrepôt de données pour être accessibles aussi facilement qu'un objet interne. Les connecteurs de données incluent Hadoop Spark. Il est possible d'accéder à plusieurs instances de bases de données distribuées à l'aide d'une seule requête SQL pour support modèles de données fédérés.

L'intégration de données intégrée en tant que service permet de se connecter à des centaines de sources de données et peut être utilisée pour documenter, extraire et charger à la fois des données basées sur des fichiers et des données en continu. Actian vous permet de vous connecter aux API REST et SOAP pour créer et gérer des intégrations.

La plateforme de données Actian fonctionne avec les structures de stockage de données les plus courantes, notamment les buckets S3, les dossiers Google Drive et le stockage Azure Blob. Les instances peuvent être déployées sur plusieurs plateformes cloud à l'aide d'une interface utilisateur standard et d'une console de gestion.