Principaux types de données
Il existe trois grands types de données : structurées, semi-structurées et non structurées. Les données peuvent présenter les caractéristiques suivantes :
- Les données primaires proviennent d'une source originale, telle qu'une balance.
- Les données secondaires proviennent d'une source secondaire, telle qu'un rapport qui interprète les données originales.
- Les données qualitatives sont subjectives par nature.
- Les données quantitatives sont des valeurs numériques telles qu'un score.
- Les données discrètes sont des nombres entiers non arrondis.
- Les données continues peuvent être des mesures arrondies.
Types de données d'Actian
Dans cet article, nous nous concentrerons sur les types de données auxquels les systèmes de gestion de bases de données (SGBD) d'Actian peuvent accéder. Ceux-ci se répartissent dans les cinq catégories suivantes :
- Caractère
- Numérique
- Date et heure
- Résumé
- Booléen
Données sur les caractères
Les types de données de caractères sont des chaînes de caractères ASCII, imprimables et non imprimables. Les caractères alphabétiques majuscules et minuscules sont acceptés littéralement. Les données de caractères peuvent être de longueur fixe ou variable. Les colonnes de longueur variable occupent plus d'espace qu'un type de longueur fixe car un spécificateur de longueur doit être stocké. Si un champ de données peut contenir une valeur nulle, un octet supplémentaire est utilisé pour stocker un indicateur de nullité.
Les espaces dans les chaînes de caractères sont traités comme faisant partie de la chaîne. Une chaîne de longueur fixe telle que CHAR(4) sera complétée par des espaces de fin comme "ABC ". Les espaces de début et de fin sont significatifs lors de la comparaison des valeurs.
Comme pour les chaînes CHAR de longueur fixe, les chaînes de longueur variable ou VARCHAR peuvent contenir n'importe quel caractère, y compris les caractères non imprimables, à l'exception du caractère ASCII nul, qui occupe un octet supplémentaire s'il est autorisé. Les caractères vides sont significatifs lorsqu'ils sont stockés ou comparés. La plateforme de données Actian utilise les types de données NCHAR et NVARCHAR pour stocker les caractères encodés UTF8.
Données JSON
Un exemple de type de données semi-structurées est JSON. JSON utilise son propre type de données. Les valeurs JSON sont stockées dans n'importe quelle colonne de chaîne, telle que CHAR, VARCHAR, NCHAR et NVARCHAR. Les valeurs peuvent être des scalaires, des tableaux ou des objets JSON.
A JSON object is a comma-separated list of key:value pairs surrounded by brackets {}.
La clé doit être une chaîne de caractères entre guillemets. Une valeur peut être n'importe quelle valeur JSON, y compris un objet JSON ou un tableau JSON. Elle ne peut pas être vide, et les espaces blancs sont ignorés dans une chaîne d'objet JSON, à l'exception des espaces blancs entre guillemets d'une chaîne.
Les chaînes de données semi-structurées XML et JSON sont stockées sous forme de chaînes de longueur variable.
Données numériques
Types de données entières
Quatre types de données Integer sont utilisés pour contenir des nombres entiers. Plus le type de données utilise d'octets, plus le nombre qu'il peut contenir est important. Les quatre types de données entières utilisés par la plateforme de données Actian sont les suivants :
- INTEGER1 ou TINYINT (un octet)
- INTEGER2 ou SMALLINT (deux octets)
- INTEGER4 ou INTEGER (quatre octets)
- INTEGER8 ou BIGINT (huit octets)
Données décimales
Le type de données décimal enregistre les nombres fractionnaires en spécifiant le nombre total de chiffres et le nombre de décimales. Par exemple, DECIMA(20,5) stocke un nombre avec 20 chiffres de précision, 5 étant à droite de la virgule.
Type de données à virgule flottante
Les valeurs à virgule flottante peuvent être exprimées sous la forme FLOAT4 pour une précision de quatre octets ou FLOAT8 pour une précision de 8 octets. La précision exacte des nombres de 4 octets dépend du processeur. En interne, les nombres de huit octets sont arrondis à quinze chiffres décimaux.
Type de données sur l'argent
L'argent est un exemple de type de données abstraites. Les valeurs stockées sont arrondies à 2 décimales. Les valeurs doivent être comprises entre $-999,999,999,999.99 et $999,999,999,999.99. Le symbole de la devise est facultatif.
Données sur la date et l'heure
Type de données de l'horodatage
Le type de données TIMESTAMP est utilisé pour enregistrement moment où les événements se produisent. Il se compose d'une date et d'une heure, ainsi que d'un fuseau horaire facultatif. Par exemple, TIMESTAMP(5) AVEC FUSEAU HORAIRE pourrait ressembler à ceci :
2023-15-20 9:30:55.12345-08:00, ce qui correspond au fuseau horaire du Pacifique.
Résumé des données
Type de données booléen
Les colonnes BOOLEAN contiennent des valeurs littérales "VRAI" ou "FAUX", dont les valeurs internes sont 0 et 1.
Type de données de l'adresse réseau IP
Un type de données abstraites pour les adresses IPV4 et IPV6 est très utile pour le stockage et la manipulation des weblogs. Une adresse IPv4 peut ressembler à 176.12.254.1. L'adresse IPV6, plus récente, comporte beaucoup plus de variations, de sorte qu'elle se présente sous le format suivant : 2101:0cb8:8ca3:0d42:1900:8d2e:0e70:7734.
L'utilisation des données IPV4 et IPV6 permet de vérifier les erreurs d'entrée et de prendre en charge des opérateurs et des fonctions spécialisés.
Identifiant unique universel (UUID)
Un identifiant unique universel (UUID) est un identifiant unique de 128 bits généré par le système local sur demande ou chargé à partir de sources externes. Ils conviennent pour identifier de manière fiable des objets persistants sur un réseau ou pour générer des valeurs uniques telles que des identifiants de transaction.
Données géospatiales
La base de données transactionnelle Ingres offre une support approfondie des types de données géospatiales. Tous les types de données spatiales stockent les caractéristiques à l'aide du format Well-Known-Binary (WKB), une spécification de l'Open Geospatial Consortium (OGC).
Les types de données 2D existent dans un espace de coordonnées bidimensionnel représenté par les coordonnées X (longitude) et Y (latitude). Il s'agit par exemple de la géométrie et des chaînes de caractères. Les types de données 3D ajoutent une troisième dimension Z dans les espaces de coordonnées X, Y et Z. Les données 4D ajoutent une quatrième dimension à une coordonnée 3D, en fonction de l'application.
Données non structurées
Les données non structurées, telles que le texte, sont stockées au format CHAR ou VARCHAR dans la base de données. Les données vidéo et audio SONT généralement accessibles en tant qu'objet stocké en externe dans un système de fichiers à l'aide d'un connecteur de base de données tel que Spark.
Actian et les formats de données pris en charge
Vous pouvez en savoir plus sur les bases de données transactionnelles d'Actian en visitant notre site web.