Intégration des données

Avez-vous besoin d'une structure de données ?

Traci Curran

3 mars 2020

Visualisation abstraite des big data

Vous devez fournir un accès plus rapide à des données intégrées dans un environnement informatique diversifié et distribué ?

Au cours des dernières années, les organisations informatiques ont été de plus en plus sollicitées pour automatiser les systèmes et les processus impliqués dans l'intégration et la préparation de leurs données pour le reporting, en s'appuyant sur des éléments tels que les métadonnées actives, les algorithmes d'intelligence artificielle (IA) / d'apprentissage automatique (ML), et les graphes de connaissances.

Rassembler les sources de données traditionnelles et les enrichir à l'aide de ces capacités modernes nécessite une approche de conception différente - c'est là qu'intervient une structure de données.

Qu'est-ce qu'une structure de données ?

Une structure de données est un concept de conception (une architecture) qui fournit un ensemble cohérent de services et de capacités de données à travers des environnements sur site et en nuage. Elle vous permet d'abstraire vos données provenant de systèmes physiquement et logiquement différents en un ensemble commun d'objets de données afin de pouvoir les traiter comme un ensemble de données d'entreprise unifié.

Ceci est particulièrement important pour soutenir les initiatives de transformation numérique où les processus d'entreprise exploitent différents systèmes qui sont sur site, répartis sur plusieurs clouds, et même déployés à distance (des choses comme l'IoT et les applications mobiles). En utilisant un tissu de données, les entreprises peuvent parvenir à un partage des données plus rapide et plus efficace des données entre les systèmes, ce qui conduit à des perspectives commerciales plus intégrées et à une plus grande agilité commerciale.

Un tissu de données est constitué d'un ensemble de couches de capacités qui transforment et abstraient les données provenant de différentes sources sur leur chemin vers le consommateur de données. Il s'agit d'une chaîne de valeur dans laquelle les matières premières sont transformées en produits finis consommables par le biais d'une série d'étapes à valeur ajoutée. Un tissu de données typique se compose de cinq étapes de raffinement qui se déroulent en trois couches de capacités.

Les données brutes sont d'abord organisées dans un atalogue de donnéesmétadonnées . Chaque source de données comprend des informations contextuelles appelées "métadonnées" sur la nature des données, leur date de collecte, leur format, etc. La couche de catalogage effectue un "tri grossier" des données brutes.

Ce catalogue informe ensuite une couche de graphe de connaissances où les analyses sont appliquées pour activer les métadonnées et déduire les connexions et les relations qui peuvent exister. Des algorithmes d'IA/ML sont utilisés pour enrichir les métadonnées actives afin d'aider à interpréter les données, à les replacer dans leur contexte et à les simplifier pour que des règles d'automatisation puissent être définies pour l'intégration des données.

Les données du graphe de connaissances sont ensuite transférées dans une couche d'intégration où les données provenant de différentes sources sont rassemblées et réconciliées en un ensemble de données commun et intégré. Cet ensemble de données est ensuite utilisé pour piloter l'orchestration et l'automatisation des données qui transmettent les données pertinentes aux personnes et aux systèmes qui en ont besoin.

Quels sont les problèmes auxquels répond une structure de données ?

Le concept de conception de tissu de données vise à résoudre l'éternel problème des données : "Comment puis-je faire en sorte que des éléments fondamentalement différents se ressemblent suffisamment pour les traiter comme s'ils étaient identiques ?" Au fur et à mesure que les environnements informatiques se développent et évoluent, le défi devient de plus en plus important et l'urgence de fournir une solution devient plus évidente.

  • Les silos de données entre les différentes fonctions de l'entreprise.
  • Diversité des sources et des types de données.
  • Les systèmes informatiques sont répartis dans des environnements d'exploitation physiques (multi-cloud, sur site, mobile, etc.).
  • Demande de données en temps réel et axé sur des événements pour la prise de décision.
  • Croissance des activités d'analyse opérationnelle et de modélisation des données menées par les entreprises.

Les systèmes informatiques deviennent de plus en plus complexes alors que les entreprises exigent des données plus simples et plus rapides pour la prise de décision. La structure de données permet de répondre à ces deux besoins.

Comment la plate-forme d'intégration en tant que service peut aider à Support votre structure de données (Data Fabric)

Si vous souhaitez mettre en œuvre une structure de données, avant de pouvoir commencer à cataloguer et à affiner les données à travers les couches de la structure, vous devez d'abord les collecter à partir de toutes leurs différentes sources et les rassembler en un seul endroit. Il vous permet également de gérer et d'orchestrer les connexions entre votre tissu de données et tous les systèmes de consommation cibles.

Une solution IPaaS comme Actian DataConnect fournit la connectivité nécessaire à la réussite de la conception. La structure de données fournit une plateforme qui permet la transformation des données ; la solution IPaaS gère la connectivité, la sécurité, l'accès autorisé et l'orchestration du flux de données dans l'ensemble de votre organisation.

Avez-vous besoin d'une structure de données ?

Si vous disposez d'un environnement informatique complexe, d'un environnement commercial en constante évolution et de décideurs qui exigent des données en temps réel, vous devez envisager une structure de données. Vous devez également envisager une plate-forme d'intégration comme Actian DataConnect pour gérer le flux de données au sein de votre organisation de manière cohérente et contrôlée.

Pour en savoir plus, consultez le site www.actian.com/dataconnect.

Portrait de Traci Curran

À propos de Traci Curran

Traci Curran est directrice du marketing des produits chez Actian, où elle se concentre sur la plateforme de données Actian. Avec plus de 20 ans d'expérience dans le marketing technologique, Traci a précédemment occupé des postes de direction en marketing chez CloudBolt Software, Racemi (acquis par DXC Corporation), ainsi que dans certaines des startups les plus innovantes au monde. Traci est passionnée par le fait d'aider les clients à comprendre comment ils peuvent accélérer l'innovation et gagner un avantage concurrentiel en tirant parti de la transformation numérique et des technologies cloud.