Gestion des données

Il est temps que les historiens des données deviennent... de l'histoire

Actian Corporation

17 juillet 2021

les mains des historiens des données

Les historiens des bases de données...l'histoire ?

Pourquoi une base de données moderne capable de traiter des séries temporelles peut simplifier et améliorer l'analyse de ces données.

Malgré l'image professorale que le terme suggère, un historien des données n'est pas un instructeur ou un chercheur, mais une solution logicielle conçue à cet effet. L'évolution de l'utilisation et de la gestion des données opérationnelles a éclipsé le besoin de solutions logicielles d'historien des données.

Qu'est-ce qu'un historien des données ?

Il existe de nombreux environnements de technologie opérationnelle (OT) dans les secteurs de la fabrication, du pétrole et du gaz, de la recherche en ingénierie et dans d'innombrables autres industries. Dans ces environnements, des équipements complexes, des machines et des réseaux de capteurs et de dispositifs génèrent des séries de données temporelles. Ces flux temporels vont des données de capteurs représentant la pression, le volume et la température aux flux vidéo pour la vision industrielle et la surveillance.

Dans un premier temps, ces flux ont été ignorés ou échantillonnés uniquement à des taux périodiques faibles. Au fur et à mesure que les flux de données temporelles augmentaient en volume et que le traitement local des données intégrait la réconciliation de flux multiples, les ingénieurs de l'OT ont commencé à construire des systèmes de collecte, d'agrégation et de traitement minimal des données afin de mieux gérer ces flux de données temporelles. Finalement, ces systèmes propriétaires et sur mesure ont été collectivement appelés "historiens de données".

L'écart entre les processus de l'historien des données

L'utilisation et les utilisateurs des données d'ergothérapie ont tous deux beaucoup changé au cours des dernières années. De plus en plus, les données OT sont exploitées par une multitude d'autres acteurs au sein d'une organisation, au-delà des professionnels de l'OT. Ces nouveaux utilisateurs comprennent les développeurs, les analystes commerciaux et les scientifiques des données qui soutiennent l'OT, ainsi que les gestionnaires de produits et de services qui dirigent l'entreprise.

Cependant, aucune solution logicielle d'historien des données n'a jamais été conçue pour être utilisée avec une série de systèmes externes ou par des utilisateurs qui n'étaient pas des professionnels de l'ergothérapie. Au lieu de cela, la plateforme d'historien de données typique n'était guère plus qu'une bibliothèque de données collectées par les professionnels de l'ergothérapie et destinées à leur seul usage. Ces derniers ont généralement conçu chaque solution logicielle d'historisation des données à partir de zéro, directement ou par l'intermédiaire de fournisseurs d'équipements de fabrication ou d'autres équipements spécialisés. Par essence, les solutions d'historiens de données sont des bibliothèques construites uniquement pour les bibliothécaires.

En outre, la plupart des logiciels d'historisation des données étaient mis en œuvre sur du matériel ancien coûteux. Les contraintes de ressources et l'absence de normes ont eu pour conséquence que les fonctionnalités ont été réduites au minimum et se sont concentrées uniquement sur les exigences locales et immédiates de l'infrastructure et du processus OT en question. Il en résulte que les solutions logicielles d'historisation des données ne sont pas facilement extensibles à des fonctions telles que l'analyse et la visualisation localisées ou le partage de données entre systèmes locaux. Il est également difficile, voire impossible, pour la plateforme typique d'historien des données d'échanger facilement et en toute sécurité des données avec des systèmes dorsaux modernes à des fins d'analyse et de visualisation plus poussées.

Une technologie qui permet aux données historiques de façonner l'avenir

Comme dans tous les autres secteurs de l'économie et des technologies de l'information, la technologie de gestion des données évolue en permanence et de nouvelles fonctionnalités apparaissent chaque jour. Actuellement, trois principaux changements technologiques se combinent pour dépasser les capacités et les résultats attendus des logiciels d'historiens de données.

Bases de données modernes de séries chronologiques : Au-delà de l'historien des données

En dehors du domaine OT, le reste des données de votre entreprise est probablement stocké dans des bases de données relationnelles traditionnelles et des entrepôts de données. Les solutions d'historisation des données étaient axées sur la capture de données largement structurées dans des formats de séries temporelles. Les données d'aujourd'hui sont un vaste ensemble de données capturées par ces anciens systèmes.

Les bases de données modernes de séries temporelles comprennent des fonctionnalités traditionnelles de données de séries temporelles. Cependant, ces solutions modernes sont conçues et optimisées pour capturer la chronologie des données et ingérer des données provenant de sources de données streaming non structurées et multi-variables. Il peut s'agir de Binary Large Objects (BLOB), de données conformes à la norme ouverte JavaScript Open Notation (JSON) ou de la toute dernière connectivité de l'Internet des objets (IoT).

Analyse et rapports ad hoc : les bonnes données pour tous

Les historiens des données ont tendance à s'appuyer sur les interfaces de programmation d'applications (API) NoSQL. Celles-ci stockent et accèdent aux données sur la base de ce que l'on appelle les "valeurs clés", plutôt que dans les lignes et les colonnes des bases de données traditionnelles. Les API NoSQL sont idéales pour la collecte et la gestion des données locale gestion des données. Cependant, elles ne sont pas facilement accessibles pour l'analyse ad hoc et la création de rapports après la collecte - en particulier par les analystes commerciaux et les scientifiques des données en dehors du domaine de la technologie de l'information.

Les bases de données modernes de séries temporelles fournissent à la fois une API NoSQL et des API conformes à la norme SQL (Structured requête Language) de l'American National Standards Institute (ANSI). Cette dernière caractéristique permet d'extraire facilement des données pour support analyse ad hoc à distance, l'établissement de rapports et la visualisation par le biais d'outils informatique décisionnelle et d'établissement de rapports largement utilisés qui reposent sur des mécanismes de connectivité informatique standard tels que Java Database Connectivity (JDBC) et Open Database Connectivity (ODBC).

Intelligence artificielle (IA) : L'histoire au service de Support prévision de l'avenir

Les solutions traditionnelles d'historisation des données peuvent permettre aux responsables des opérations sur le terrain de détecter les problèmes liés à leurs infrastructures, par exemple lorsque la pression est trop élevée ou qu'une pièce est défectueuse. Mais ces alertes sont toujours déclenchées après coup. La vitesse de collecte et de traitement de la solution d'historien de données spécifique détermine en partie la rapidité de l'intervention, mais la rétrospection est toujours la solution par défaut.

L'IA, alimentée par des capacités modernes d'apprentissage automatique (ML), peut fournir des alertes plus perspicaces. En fonction des combinaisons de données, des modèles passés et de la capacité à les analyser, les successeurs des solutions d'historisation des données pilotées par l'IA peuvent même fournir des conseils prédictifs sur le moment où une pièce est susceptible de tomber en panne. Les bases de données de séries temporelles modernes et intégrées peuvent support capacités d'IA et de ML localement au point d'action dans le domaine de l'OT en intégrant l'OT avec l'informatique dorsale. Ainsi, les scientifiques et les ingénieurs des données peuvent concevoir des capacités d'IA et de ML pour les systèmes informatiques dorsaux. Les développeurs et les ingénieurs OT frontaux peuvent ensuite invoquer ces capacités dans l'environnement OT. Cette approche offre une manière nouvelle et moderne d'interagir avec les données de votre entreprise pour générer des informations plus utiles et des résultats améliorés.

Respecter l'héritage, mais se tourner vers l'avenir

Les solutions d'historisation des données ont joué un rôle crucial dans l'évolution de la technologie de l'information et de l'industrie informatique depuis les années 1980 et avant, et leurs contributions doivent être reconnues et respectées. Toutefois, leur temps est révolu et des solutions technologiques modernes les remplacent. Celles-ci vous permettent de mieux gérer les données dont votre entreprise a besoin aujourd'hui et de disposer d'informations plus rapides, plus complètes et plus précises pour l'avenir.

Actian est le leader du secteur des entrepôts de données opérationnels et des solutions de gestion des données en périphérie pour les entreprises modernes. Avec un ensemble complet de solutions pour vous aider à gérer les données sur site, dans le nuage et à la périphérie, y compris les appareils mobiles et IoT. Actian peut vous aider à développer la base technique dont vous avez besoin pour support une véritable agilité commerciale. Pour en savoir plus, visitez le site www.actian.com.

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.