Recueillez-vous les bonnes sources de données ?
Actian Corporation
8 juillet 2019

La quantité et la qualité sont très importantes pour vos données, mais il existe une troisième dimension au puzzle de vos données qui est encore plus importante : le contenu.
Alors que votre entreprise évalue de nouvelles sources de données et des améliorations à apporter à vos données existantes, posez-vous la question suivante : "Recueillons-nous les bonnes données ?" Voici trois conseils pour déterminer si vous acquérez les données dont vous avez réellement besoin ou si vous créez simplement un fouillis de données.
Point de vue et perspective
Chaque ensemble de données que vous acquérez vous fournit un point de vue unique sur les activités de votre entreprise et sur son environnement externe. Bien qu'il soit intéressant en soi, un seul ensemble de données fournit rarement (voire jamais) une image complète. Il y a des lacunes, des angles morts, des biais et bien d'autres problèmes que vous devrez résoudre. Des ensembles de données similaires ou provenant de sources similaires sont susceptibles de présenter des défauts similaires.
Vous pouvez éviter cela grâce à la diversité des données. En agrégeant des données provenant de différentes sources, vous pouvez rassembler plusieurs points de vue sur vos opérations, ce qui permet d'obtenir une perspective plus holistique.
Les meilleures méthodes pour identifier les nouvelles sources de données dont vous avez besoin consistent à rechercher les lacunes dans vos données actuelles ainsi que les domaines dans lesquels les sources de données sont toujours en accord les unes avec les autres. Un certain niveau de conflit entre les données est une bonne chose, car il indique que vous recueillez différents points de vue qui décrivent des facettes ou des dimensions uniques de votre entreprise.
Duplication et redondance
Bien que ces mots puissent sembler avoir la même signification, dans le contexte de la sélection de nouvelles sources de données, il y a une distinction importante à comprendre. Les données dupliquées (qui sont les mêmes) peuvent généralement être retracées jusqu'au même système source, même si elles sont acquises par des canaux différents. Un bon exemple est celui d'une liste de produits obtenue à partir du système de marketing ou du système de fabrication.
Si les listes sont identiques, soit l'un des deux systèmes est le système d'enregistrement et les données ont été copiées dans l'autre, soit les données proviennent d'un autre endroit. Ce point est important car l'ajout de données en double ne crée pas de valeur ajoutée pour votre entreprise - vous disposez déjà de cet ensemble de données.
Les données redondantes (ensembles de données différents mais qui se recoupent) sont très précieuses car elles reflètent différentes perspectives. Dans l'exemple du marketing et de la fabrication, la liste des produits de la fabrication peut contenir les produits que votre entreprise fabrique ou est en train de fabriquer.
La liste des produits marketing peut contenir des produits que vous revendez à destiers (mais que vous ne fabriquez pas vous-même), mais peut ne pas inclure de nouveaux produits que la R&D est encore en train de développer. Certaines données sont identiques, mais les éléments qui diffèrent sont très instructifs.
Des données actualisées
Chaque donnée que vous collectez est horodatée, c'est-à-dire qu'elle a été créée ou observée. Les données commencent à vieillir à partir du moment où elles sont créées, et non pas lorsqu'elles sont collectées et ajoutées à un entrepôt de données. Il est important de comprendre quand vos données ont été collectées et à quel point les données que vous ingérez à partir de différentes sources de données sont à jour. Pour être efficaces, les processus commerciaux numériques nécessitent des données en temps réel.
Pour vous assurer que vous recueillez les données les plus récentes, recherchez l'origine de vos données. L'idéal est de collecter les données directement à partir du système source où elles ont été créées, et non à partir d'un système en aval qui n'actualise les données que périodiquement.
L'horodatage des données est particulièrement important dans les situations où vous devez effectuer des analyses de séries temporelles pour identifier les tendances opérationnelles et les problèmes de qualité ou pour prévoir des événements futurs. Plus tôt vous pourrez acquérir les données, plus tôt vous serez en mesure de les analyser et de mettre à jour vos rapports opérationnels et vos prévisions, ce qui se traduira par des opérations commerciales plus souples.
Votre entreprise évolue en permanence, qu'il s'agisse de vos activités ou de votre environnement. Pour réussir dans un environnement hautement concurrentiel, il est essentiel d'affiner en permanence vos sources de données afin de vous assurer que vous obtenez une perspective holistique qui génère des informations exploitables et offre une visibilité en temps réel. Il ne s'agit pas seulement de collecter plus de données, ou des données de meilleure qualité - vous devez collecter les bonnes données.
Pour en savoir plus sur les produits de gestion des données Actian, cliquez ici.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.