En utilisant des services basés sur le cloud, le Big Data as a Service (BDaaS) permet à une entreprise d'analyser des ensembles de données volumineux ou complexes.
Pourquoi le Big Data en tant que service est-il important ?
L'approche traditionnelle pour accéder aux informations fournies par les big data consiste à acquérir une grappe de serveurs hébergés dans un centre de données sur site. L'évolutivité est limitée à la quantité de matériel acheté, et l'épuisement de la capacité implique des mises à niveau coûteuses et des retards supplémentaires.
Quels sont les avantages du Big Data en tant que service ?
Les principaux avantages de l'utilisation du big data en tant que service sont les suivants :
- Économie de l'informatique en nuage - L'entreprise peut souscrire à un service d'abonnement sans investissement initial et en ne payant que pour le processeur et le stockage consommés.
- évolutivité élastique - Un service basé sur l'informatique en nuage peut fournir un processeur et un espace de stockage à la demande presque instantanément et bien plus qu'un centre de données interne peut le faire.
- Délai de rentabilité - Ce délai est plus court avec un service de big data car le matériel et les logiciels nécessaires sont disponibles dès le début de l'abonnement ou de la période d'essai - pas d'attente pour le service informatique.
- Gestion des systèmes - Les fournisseurs de services en nuage gèrent la plupart des tâches de gestion des systèmes de bas niveau, ce qui réduit la charge de gestion des équipes informatiques interne
- Mises à jour logicielles - Elles sont prises en charge par le fournisseur de services en nuage et/ou de SaaS, ce qui réduit le temps d'arrêt par rapport aux mises en œuvre traditionnelles sur site.
- Haute disponibilité - Les solutions basées sur l'informatique en nuage peuvent offrir des services de reprise après sinistre en répliquant les services dans plusieurs centres de données en nuage situés dans différentes zones géographiques, réduisant ainsi tout impact dû au temps d'arrêt arrêt dû à des pannes de courant ou à des catastrophes naturelles qui pourraient affecter un seul centre de données.
Défis potentiels
- Conformité des données - De nombreuses entreprises traitent des données réglementées qui doivent être conservées sur place dans le centre de données de l'entreprise. Un cloud privé répond souvent aux exigences de conformité car les données ne quittent jamais l'environnement cloud dédié de l'entreprise.
- Analyse des données - Les données doivent être téléchargées dans le nuage pour être analysées. Cela peut prendre du temps. Idéalement, l'entreprise créera son lac de données ou son entrepôt de données dans sa plateforme cloud préférée afin que les données puissent être traitées là où elles ont été créées.
- Migration des données - Le passage à un autre fournisseur de services en nuage peut s'avérer coûteux, car ces derniers facturent souvent des frais de sortie basés sur le volume de données. C'est le cas des offres de données proposées par les fournisseurs de SaaS basés dans le nuage ou des solutions de données des fournisseurs de services dans le nuage comme Google et AWS.
Services Big Data
Tous les grands fournisseurs de services en nuage proposent des services permettant aux clients de planifier leurs stocks de big data existants dans le nuage. Il s'agit notamment des services suivants
- Amazon Web Services (AWS) fournit Elastic MapReduce (EMR) pour fournir le BDaaS.
- Microsoft Azure HDInsight est une solution big data basée sur le cloud qui fournit des clusters Hadoop, Spark et Hive gérés.
- Google Cloud Platform (GCP) - Google Cloud Dataproc est un service cloud entièrement géré pour l'exécution de clusters Apache Spark et Apache Hadoop.
- Actian propose le BDaaS, qui est portable sur les trois fournisseurs de cloud, offrant aux clients la flexibilité d'exécuter des analyses quelle que soit la plateforme de cloud qui héberge leurs données.
Actian
La plateforme de données Actian est conçue pour offrir un BDaaS sur AWS, Azure et Google Cloud. La plateforme utilise l'API Hadoop Spark pour accéder aux formats de données, y compris ORC et Parquet. Les requêtes de la plateforme de données Actian peuvent connecter les données à travers les instances de l'entrepôt de données. Cette fonctionnalité de requête distribuée permet aux clients de stocker leurs données à proximité de l'endroit où elles ont été créées et d'effectuer des analyses de données où qu'elles se trouvent.
Les fonctionnalités d'intégration de données de la plateforme de données Actian fonctionnent avec les structures de stockage de données les plus courantes, notamment les buckets S3, les dossiers Google Drive et le stockage Azure Blob.
détection des fraudes
L'un des plus grands assureurs automobiles du Royaume-Uni utilise la plateforme de données Actian pour la détection des fraudes. De nombreuses variables entrent dans le calcul de la prime d'assurance d'un client potentiel, telles que les données démographiques, la cote de crédit, les demandes d'indemnisation et les antécédents de conduite. Ils utilisent également Actian pour construire des modèles de détection des anomalies et des comptes potentiellement frauduleux.
Traitement des demandes de remboursement des soins de santé
Le traitement des demandes de remboursement des soins de santé peut être très complexe et prendre beaucoup de temps. Les assureurs maladie font appel à des agences externes pour valider les demandes, s'assurer que les prestataires de soins ne surfacturent pas les traitements des patients et détecter les demandes frauduleuses. Le big data en tant que service joue un rôle crucial en garantissant la disponibilité d'une puissance de calcul suffisante pour traiter les pics. Les données relatives aux demandes de remboursement comprennent des données non structurées sous forme de documents scannés et des données structurées provenant des systèmes de facturation qui doivent être traitées.
Commerce de détail
Un grand détaillant américain qui exploite des centaines de magasins de proximité dans les relais routiers et les petites villes utilise la BDaaS pour analyser les paniers des clients afin d'optimiser les produits pour chaque point de vente. Une chaîne de magasins de bricolage française utilise le big data en tant que service pour prévoir les demandes futures en fonction des saisons, des jours fériés et des conditions météorologiques prévues, afin de pouvoir stocker de manière proactive en fonction des conditions attendues.