Qu'est-ce qu'un pétaoctet ?

Un pétaoctet (PB) correspond à 1 024 téraoctets ou 1 048 576 gigaoctets.
Quelle est la taille d'un pétaoctet ?
En commençant par le plus petit, la progression suivante a pour but d'illustrer un pétaoctet dans son contexte :
- Qu'est-ce qu'un pétaoctet ? Dans un système informatique, les tailles relatives sont exprimées en octets. Un octet se compose de 8 bits. Un bit représente un 0 ou un 1. Lorsqu'ils écrivent des applications en assembleur ou en code machine, les programmeurs utilisent des valeurs hexadécimales pour exprimer les valeurs des octets. En hexadécimal, une chaîne de 8 bits contenant tous les zéros s'écrit x'00, et une chaîne contenant tous les uns s'écrit x'FF.
- Les octets sont généralement utilisés pour représenter les valeurs des touches d'un clavier. La façon dont ils sont affichés sous forme de caractères varie en fonction de la région géographique et linguistique du clavier. Les premiers ordinateurs personnels utilisant l'Intel 8080 et le Zilog utilisaient un bus de 8 bits, et le processeur traitait des instructions de 8 bits. Ces systèmes ne pouvaient adresser que 32 Ko de mémoire vive.
- Un kilo-octet (Ko) correspond à 1 024 octets. La taille d'un petit fichier peut être exprimée en Ko.
- Les mégaoctets (Mo) sont l'unité de stockage suivante dans un système informatique. Un mégaoctet correspond à 1 024 Ko. Le mégaoctet est utilisé pour décrire la taille d'un fichier volumineux, tel qu'un fichier image. La taille du fichier est importante lorsqu'il s'agit de joindre une image à un courriel ou de partager un lien vers un fichier plus volumineux.
- Un gigaoctet (Go) correspond à 1 024 mégaoctets. Les dispositifs de stockage de plus grande capacité, tels que les cartes mémoire, sont généralement définis en gigaoctets.
- Un téraoctet (TB) est composé de 1 024 gigaoctets. De nos jours, la capacité des disques durs des ordinateurs est exprimée en téraoctets. L'utilisation du stockage en nuage est généralement exprimée en téraoctets par mois.
- Un pétaoctet (PB) correspond à 1 024 TB. Il est difficile d'imaginer 1 125 899 906 842 624 octets. La taille d'un parc de serveurs peut être décrite en pétaoctets.
- Un exaoctet (EB) correspond à 1 024 pétaoctets. Un exaoctet est si grand que même le stockage total géré par un fournisseur de cloud public ne représente qu'une fraction d'un exaoctet.
- Un zétaoctet (ZB) correspond à 1 024 exaoctets. Toutes les données du monde représentent quelques zétaoctets.
- Un Yottabyte (YB) correspond à 1 024 Exabytes.
- Un Brontobyte (BB) correspond à 1 024 Yottabytes.
- Un géopbyte correspond à 1 024 brontobytes. Ces nombres sont utiles en astrophysique, en recherche sur l'ADN et en physique nucléaire.
Stockage des bases de données
Avant Hadoop, les grandes entreprises utilisaient des bases de données commerciales sur site. Les entrepôts de données centralisés d'Oracle, d'IBM et de Teradata revendiquaient les plus grands entrepôts de données d'entreprise (EDB). Le projet open-source Apache Hadoop a mis les bases de données en cluster à faible coût à la portée des petites entreprises, et le mouvement Big Data a commencé. Les premières implémentations de Hadoop utilisaient des moteurs de base de données tels que Hive, qui fournissaient une interface SQL pour interroger les données stockées sur le cluster, mais qui étaient très lents. Actian Vector est rapidement devenu la technologie de base de données la plus rapide sur les clusters Hadoop grâce à sa capacité à stocker les données dans leur format en colonnes et à utiliser le traitement vectoriel pour paralléliser les requêtes sur tous les cœurs et nœuds de serveurs.
Dans les années 1990, une base de données d'un téraoctet était appelée "Very Large Database" (VLDB) et était souvent utilisée pour établir des records de référence en matière de traitement des transactions. En 2010, Facebook a revendiqué le plus grand Cluster Hadoop classique Cluster Hadoop Big Data Cluster Hadoop , avec une taille de 21 pétaoctets et une croissance d'un demi-po par jour.
Aujourd'hui, le marché des bases de données a évolué pour stocker, requête et exploiter des données structurées et non structurées. L'intelligence artificielle (IA) et l'apprentissage automatique (ML) permettent de trouver des corrélations dans de grandes quantités de données brutes.
Actian et les grandes bases de données
La plateforme de données Actian utilise une capacité de requête hautement parallèle fournie par le moteur de base de données à traitement vectoriel intégré.
Actian est un pionnier dans l'industrie des bases de données. La base de données Ingres a été la première à développer une requête distribuée avec Ingres-Star. Aujourd'hui, Ingres Next offre une base de données de traitement des transactions solide comme le roc, utilisant le stockage en lignes, ainsi qu'une extension intégrée utilisant le stockage en colonnes , optimisée pour les requêtes d'entreposage de données.
La plateforme de données Actian fonctionne sur site et dans le nuage. La technologie d'intégration de données intégrée se connecte à des centaines de sources de données. Les connecteurs de données externes support accès SQL aux formats Spark.