Entrepôt de données

Les 5 principaux pièges des entrepôts de données traditionnels

Actian Corporation

11 octobre 2018

concept de technologie cloud hybride avec entrepôts de données

Au cours des deux dernières décennies, les solutions d'entrepôt de données ont évolué et divergé pour répondre à une myriade de cas d'utilisation. Parallèlement, le rythme des affaires continue de s'accélérer, ce qui rend plus difficile le maintien de la compétitivité. Ces nouvelles exigences peuvent mettre à rude épreuve les capacités des entrepôts de données traditionnels.

Voici 5 des pièges les plus courants qui peuvent faire trébucher les entrepôts de données traditionnels:

Monnaie

Les entrepôts de données doivent fournir des données de plus en plus actuelles à mesure que les organisations sont de plus en plus contraintes de fonctionner en temps réel ou dans l'instant. Les bases de données SQL Hadoop ne parviennent généralement pas à gérer des flux continus de mises à jour, car le système de fichiers est optimisé pour des mises à jour par lots peu fréquentes, avec une fenêtre mobile de données historiques. Le manque de données actuelles peut signifier que les entreprises ne parviennent pas à répondre aux menaces et aux opportunités suffisamment rapidement pour rester compétitives.

Sécurité des applications

Les réglementations de plus en plus strictes en matière de protection de la vie privée, telles que le GDPR, et la fréquence croissante des violations de données ont fait de la sécurité une question de réputation de premier plan. Les bases de données bas de gamme peuvent manquer de fonctions de cryptage avancées pour les données en vol et au repos. Le masquage des données au niveau des colonnes est une fonctionnalité avancée qui fait défaut à de nombreuses bases de données, ce qui constitue un sérieux écueil.

Rapidité

Il existe de nombreuses raisons pour lesquelles une requête analytique peut être lente. Il se peut que le DBA ne l'ait pas anticipé et n'ait pas défini d'index spécifique, ce qui rend la base de données inadaptée aux requêtes ad hoc. Ce problème est aggravé par la tendance actuelle aux analystes de données citoyens, où les utilisateurs ayant une compréhension limitée des structures de données sous-jacentes peuvent mettre une base de données à genoux.

Prix

Au fur et à mesure que les volumes et les types de données augmentent, l'augmentation de la capacité peut s'avérer coûteuse. C'est particulièrement vrai pour les solutions basées sur des appliances telles que IBM Netezza, où l'augmentation de la capacité peut signifier l'achat d'une appliance plus grande. Des solutions plus ouvertes basées sur Hadoop et sur le cloud qui utilisent des serveurs et des systèmes d'exploitation de base sont devenues populaires pour faire face au coût de l'infrastructure, mais elles présentent d'autres problèmes de coûts cachés, tels que l'exigence de compétences coûteuses et l'enfermement.

Déploiement

Certaines bases de données requièrent des compétences considérables en matière de développement et d'administration de bases de données. Oracle et Teradata font partie de ce camp. Les services de base de données basés sur le cloud s'attaquent à cette complexité dans une certaine mesure, il y a donc de l'espoir.

Chaque organisation a des priorités différentes et peut donc classer ces cinq pièges différemment. Ne manquez pas mon prochain blog dans la série "Qu'est-ce qu'un entrepôt de données opérationnel et pourquoi est-ce la prochaine grande nouveauté ?", où je décrirai la prochaine grande nouveauté dans l'analyse des données, ses avantages et bien d'autres choses encore.

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.