Intelligence des données

Qu'est-ce qu'un graphe de connaissances et comment améliore-t-il les catalogues de données ?

Actian Corporation

4 novembre 2020

graphe de connaissances pour les catalogues de données

Les graphes de connaissance interagissent avec nous depuis un certain temps. Qu'il s'agisse d'expériences d'achat personnalisées par le biais de recommandations en ligne sur des sites tels qu'Amazon ou Zalando, ou par l'intermédiaire de notre moteur de recherche préféré Google.

Cependant, ce concept reste souvent un défi pour la plupart des gestionnaires de données et d'analyses qui peinent à agréger et à relier leurs actifs commerciaux afin d'en tirer profit comme le font ces géants du web.

Pour support affirmation, Gartner a déclaré dans son article "How to Build Knowledge Graphs That Enable AI-Driven Enterprise Applications" (Comment construire des graphes de connaissances qui permettent des applications d'entreprise pilotées par l'IA) que :

"Les responsables des données et de l'analyse sont confrontés à un engouement croissant pour les graphes de connaissances, mais peinent à trouver des cas d'utilisation significatifs susceptibles d'emporter l'adhésion de l'entreprise.

Dans cet article, nous définirons le concept de graphe de connaissances en l'illustrant par l'exemple de Google et en soulignant comment il peut enrichir un catalogue de données.

Qu'est-ce qu'un graphique de connaissances ?

Selon GitHub, un graphe de connaissances est un type d'ontologie. ontologie qui décrit les connaissances en termes d'entités et de leurs relations d'une manière dynamique et axée sur les données. Contrairement aux ontologies statiques, qui sont très difficiles à maintenir.

Voici d'autres définitions d'un graphe de connaissances données par divers experts : 

  • Un "moyen de stocker et d'utiliser des données, qui permet aux personnes et aux machines de mieux exploiter les connexions dans leurs ensembles de données". (Datanami)
  • Une "base de données qui stocke des informations dans un format graphique - et, surtout, qui peut être utilisée pour générer une représentation graphique des relations entre n'importe lequel de ses points de données". (Forbes)
  • "Encyclopédies du monde sémantique". (Forbes)

Grâce à des algorithmes d'apprentissage automatique, il structure toutes vos données et permet de créer des relations multilatérales entre vos sources de données.. La fluidité de cette structure s'accroît au fur et à mesure que de nouvelles données sont introduites, ce qui permet de créer davantage de relations et d'ajouter plus de contexte, aidant ainsi vos équipes de données à prendre des décisions éclairées grâce à des connexions que vous n'auriez peut-être jamais trouvées.

L'idée d'un graphe de connaissances est de construire un réseau d'objets et, plus important encore, de créer des relations sémantiques ou fonctionnelles entre les différents actifs. 

Dans un catalogue de données, un graphe de connaissances est donc ce qui représente les différents concepts et ce qui relie les objets entre eux par des liens sémantiques ou statiques.

Exemple de Google :

L'algorithme de Google utilise ce système pour rassembler et fournir aux utilisateurs finaux des informations en rapport avec leurs requêtes.

Le graphe de connaissances de Google contient plus de 500 millions d'objets, ainsi que plus de 3,5 milliards de faits et de relations entre ces différents objets.

Leur graphe de connaissances améliore la recherche Google de trois manières principales :

  • Trouvez ce qui vous convient : Effectuez des recherches non seulement à partir de mots-clés, mais aussi à partir de leur signification.
  • Obtenir le meilleur résumé : Recueillir les informations les plus pertinentes à partir de diverses sources en fonction de l'intention.
  • Approfondissez et élargissez vos connaissances : Découvrez plus que vous ne le pensiez grâce à des suggestions pertinentes.

Comment les graphes de connaissances améliorent-ils le catalogue de données Usages ?

Alimentés par un catalogue de données, les graphes de connaissances peuvent avantage votre entreprise dans sa stratégie de données :

Des résultats de recherche riches et approfondis

Aujourd'hui, de nombreux moteurs de recherche utilisent de multiples graphes de connaissances afin d'aller au-delà de la recherche de base par mots-clés. Les graphes de connaissances permettent à ces moteurs de recherche de comprendre les concepts, les entités et les relations entre eux. Les avantages sont les suivants :

  • La capacité de fournir des résultats plus approfondis et plus pertinents, y compris des faits et des relations, plutôt que de simples documents.
  • La capacité à formuler des recherches sous forme de questions ou de phrases - plutôt que sous forme de liste de mots.
  • La capacité à comprendre des recherches complexes qui font référence à des connaissances trouvées dans plusieurs éléments en utilisant les relations définies dans le graphique.

Optimisation de la découverte de données

Les données d'entreprise se déplacent d'un endroit à l'autre à la vitesse de la lumière et sont stockées dans diverses sources de données et applications de stockage. Les employés et les partenaires accèdent à ces données de n'importe où et à n'importe quel moment. identifier, localiser et classer vos données afin de les protéger et d'en tirer des informations doit être une priorité.

Les avantages des graphes de connaissances pour découverte de données incluent :

  • Une meilleure compréhension des données de l'entreprise, où elles se trouvent, qui peut y accéder et où, et comment elles seront transmises.
  • Classification automatique des données en fonction du contexte.
  • Gestion des risques et conformité réglementaire.
  • Visibilité complète des données.
  • Identification, classification et suivi des données sensibles.
  • La capacité d'appliquer des contrôles de protection aux données en en temps réel sur la base de politiques prédéfinies et de facteurs contextuels.
  • Évaluer de manière adéquate l'ensemble des données.

D'une part, il aide à mettre en œuvre les mesures de sécurité appropriées pour prévenir la perte de données sensibles et éviter des conséquences financières et de réputation dévastatrices pour l'entreprise. D'autre part, il permet aux équipes d'approfondir le contexte des données afin d'identifier les éléments spécifiques qui révèlent les réponses et de trouver des moyens de répondre à vos questions.

Recommandations intelligentes

Comme indiqué dans l'introduction, les services de recommandation sont désormais une composante familière de nombreux magasins en ligne, assistants personnels et plateformes numériques.

Les recommandations doivent adopter une approche basée sur le contenu. Dans un catalogue de données, les capacités d'apprentissage automatique combinées à un graphe de connaissances permettront de détecter certains types de données, d'appliquer des étiquettes ou des règles statistiques sur les données afin d'exécuter des suggestions d'actifs efficaces et intelligentes.

Cette capacité est également connue sous le nom de reconnaissance des formes de données. Elle consiste à pouvoir identifier des actifs similaires et à s'appuyer sur des algorithmes statistiques et des capacités de ML dérivées d'autres systèmes de reconnaissance des formes.

Ce système de reconnaissance des schémas de données aide les gestionnaires de données à maintenir leur gestion des métadonnées :

  • Identifier les doublons et copier les métadonnées
  • Détecter les types de données logiques (courriels, villes, adresses, etc.)
  • Suggérer des valeurs d'attributs (reconnaître des modèles de documentation à appliquer à un objet similaire ou à un nouvel objet)
  • Suggérer des liens - sémantiques ou de lignage
  • Détecter les erreurs potentielles afin d'améliorer la qualité et la pertinence du catalogue.

L'idée est d'utiliser certaines techniques dérivées des recommandations basées sur le contenu que l'on trouve dans les catalogues généraux. Lorsque l'utilisateur a trouvé quelque chose, le catalogue lui propose des alternatives basées à la fois sur son profil et sur la reconnaissance des formes. 

Quelques cas d'utilisation du catalogue de données renforcés par les graphes de connaissances

  • Rassembler les actifs qui ont été utilisés ou liés aux causes d'échec dans des projets numériques.
  • Trouver des actifs ayant des intérêts particuliers alignés sur les nouveaux produits pour le département marketing.
  • Générer des vues complètes à 360 des personnes et des entreprises du département des ventes.
  • Faire correspondre les besoins de l'entreprise aux personnes et aux projets pour les RH.
  • Constatation les règlements relatifs à des contrats et à des investissements spécifiques au sein du département des finances.

Conclusion

Avec l'augmentation constante des données dans les entreprises, organiser vos informations sans stratégie signifie ne pas être en mesure de rester compétitif et pertinent à l'ère du numérique. S'assurer que votre catalogue de données dispose d'un Knowledge Graph d'entreprise est essentiel pour éviter l'effet "boîte noire" tant redouté.

Grâce à un graphe de connaissances combiné à l'IA et aux algorithmes d'apprentissage automatique, vos données auront plus de contexte et vous permettront non seulement de découvrir des schémas plus profonds et plus subtils, mais aussi de prendre des décisions plus intelligentes.

Pour en savoir plus sur ce qu'est un graphe de connaissances, voici un excellent article de Timm Grosser, analyste chez BARC, intitulé "Linked Data for Analytics" (données liées pour l'analyse).

Commencez votre voyage vers le catalogue de données avec Zeenea

Zeenea est une solution 100% cloud, disponible partout dans le monde en quelques clics. En choisissant Zeenea catalogue de données, maîtrisez les coûts liés à la mise en place et à la maintenance d'un catalogue de données tout en simplifiant l'accès pour vos équipes.

Les mécanismes d'alimentation automatique, ainsi que les algorithmes de suggestion et de correction, réduisent les coûts globaux d'un catalogue et garantissent à vos équipes de données des informations de qualité dans les délais d'enregistrement .

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.