Intelligence des données

Tout ce qu'il faut savoir sur les Data Ops

Actian Corporation

26 mars 2020

opérations de données

"Au cours de l'année prochaine, le nombre d'experts en données et en analyse dans les unités opérationnelles augmentera trois fois plus vite que celui des experts dans les services informatiques, ce qui obligera les entreprises à repenser leurs modèles organisationnels et leurs compétences" - Gartner, 2020.

Les équipes chargées des données et de l'analyse jouent un rôle de plus en plus essentiel dans le soutien de divers processus d'entreprise complexes, et nombre d'entre elles sont confrontées à la difficulté d'étendre le travail qu'elles accomplissent pour fournir des données à support leurs cas d'utilisation. La pression exercée pour obtenir des résultats plus rapides et de meilleure qualité incite les responsables des données et de l'analyse à repenser l'organisation de leurs équipes.

Alors que les modèles traditionnels en cascade étaient mis en œuvre et utilisés dans les entreprises par le passé, ces méthodologies s'avèrent aujourd'hui trop longues, trop en silo et trop écrasantes.

C'est là qu'interviennent les Data OpsLe Data Ops : une approche plus agile, plus collaborative et plus favorable au changement pour la gestion des pipelines de données.

Définition des opérations de données

Gartner définit le Data Ops comme une "pratique de gestion des données collaborative gestion des données axée sur l'amélioration de la communication, de l'intégration et de l'automatisation des flux de données entre les gestionnaires de données et les consommateurs de données au sein d'une organisation". Fondamentalement, il s'agit de faciliter la vie des utilisateurs de données.

Tout comme DevOps, un ensemble de pratiques combinant le développement de logiciels (Dev) et les opérations informatiques (Ops), a changé la façon dont nous livrons les logiciels, DataOps utilise les mêmes méthodologies pour les équipes qui construisent des produits de données.

Bien qu'il s'agisse de deux cadres agiles, le DataOps nécessite la coordination des données et de tous ceux qui travaillent avec les données dans l'ensemble de l'entreprise.

Plus précisément, les responsables des données et de l'analyse devraient mettre en œuvre ces approches clés qui ont prouvé qu'elles apportaient une valeur significative aux organisations :

  • déploiement Frequency Increase: Le passage à une méthodologie de livraison plus rapide et continue permet aux organisations de réduire le temps de mise sur le marché.
  • Tests automatisés: L'élimination des tests manuels qui prennent du temps permet de fournir des données de meilleure qualité.
  • métadonnées Control: Le suivi et le reporting des métadonnées pour tous les consommateurs du pipeline de données permettent de mieux gérer les changements et d'éviter les erreurs.
  • SuiviLe suivi du comportement des données et de l'utilisation du pipeline permet une identification plus rapide des défauts - qui doivent être corrigés - et des données de bonne qualité pour de nouvelles capacités.
  • Collaboration constanteLa communication entre les parties prenantes sur les données est essentielle pour une livraison plus rapide des données.

Qui est impliqué dans les opérations de données ?

Compte tenu de l'importance des données et des cas d'usages analytiques aujourd'hui, les rôles impliqués dans la réussite d'un projet de données sont plus nombreux et plus distribués que jamais. Des équipes de science des données aux personnes extérieures à l'informatique, un grand nombre de rôles sont impliqués :

  • Analystes d'entreprise
  • Architectes de données.
  • Ingénieurs des données.
  • Gestionnaires de données.
  • Scientifiques des données.
  • Gestionnaires de produits de données.
  • Développeurs en apprentissage automatique.
  • Administrateurs de bases de données.

Comme nous l'avons mentionné plus haut, l'approche Data Ops nécessite une communication et une collaboration fluides entre ces différents rôles. Chaque collaborateur doit comprendre ce que les autres attendent de lui, ce que les autres produisent, et doit avoir une compréhension commune des objectifs des pipelines de données qu'il crée et fait évoluer.

La création de canaux permettant à ces rôles de travailler ensemble, comme un outil de collaboration ou une solution de gestion des métadonnées , est le point de départ.

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.