DEFINITION base de données (DB)
Une base de données est un ensemble d’informations organisées de manière à pouvoir être facilement accessibles, gérées et mises à jour. Les bases de données informatiques contiennent généralement des agrégats d’enregistrements ou de fichiers de données, contenant des informations sur les transactions de vente ou les interactions avec des clients spécifiques.
Dans une base de données relationnelle, les informations numériques sur un client spécifique sont organisées en lignes, colonnes et tableaux qui sont indexés pour faciliter la recherche d’informations pertinentes par le biais de requêtes SQL ou NoSQL. En revanche, une base de données graphique utilise des nœuds et des arêtes pour définir les relations entre les entrées de données et les requêtes nécessitent une syntaxe de recherche sémantique spéciale. Au moment de la rédaction du présent document, SPARQL est le seul langage de requête sémantique approuvé par le World Wide Web Consortium (W3C).
Généralement, le gestionnaire de base de données permet aux utilisateurs de contrôler l’accès en lecture/écriture, de spécifier la génération de rapports et d’analyser l’utilisation. Certaines bases de données offrent la conformité ACID (atomicité, cohérence, isolation et durabilité) pour garantir la cohérence des données et l’intégralité des transactions.
Types de bases de données
Les bases de données ont évolué depuis leur création dans les années 1960, en commençant par les bases de données hiérarchiques et en réseau, puis dans les années 1980 avec les bases de données orientées objet, et aujourd’hui avec les bases de données SQL et NoSQL et les bases de données Cloud.
Dans une vue, les bases de données peuvent être classées selon le type de contenu : bibliographique, texte intégral, numérique et images. En informatique, les bases de données sont parfois classées en fonction de leur approche organisationnelle. Il existe de nombreux types de bases de données différents, allant de l’approche la plus courante, la base de données relationnelle, à une base de données distribuée, une base de données Cloud, une base de données graphique ou une base de données NoSQL.
Base de donnée relationnelle
Une base de données relationnelle, inventée par E.F. Codd chez IBM en 1970, est une base de données tabulaire dans laquelle les données sont définies de manière à pouvoir être réorganisées et accessibles de différentes manières.
Les bases de données relationnelles sont composées d’un ensemble de tableaux contenant des données qui entrent dans une catégorie prédéfinie. Chaque tableau comporte au moins une catégorie de données dans une colonne, et chaque ligne comporte une certaine instance de données pour les catégories qui sont définies dans les colonnes.
Le langage SQL (Structured Query Language) est l’interface utilisateur et le programme d’application standard pour une base de données relationnelle. Les bases de données relationnelles sont faciles à étendre, et une nouvelle catégorie de données peut être ajoutée après la création de la base de données originale sans qu’il soit nécessaire de modifier toutes les applications existantes.
Base de données distribuée
Une base de données distribuée est une base de données dans laquelle des parties de la base de données sont stockées dans plusieurs endroits physiques, et dans laquelle le traitement est dispersé ou répliqué entre différents points d’un réseau.
Les bases de données distribuées peuvent être homogènes ou hétérogènes. Tous les emplacements physiques d’un système homogène de base de données distribuées ont le même matériel sous-jacent et exécutent les mêmes systèmes d’exploitation et applications de base de données. Le matériel, les systèmes d’exploitation ou les applications de base de données dans une base de données distribuée hétérogène peuvent être différents à chacun des emplacements.
Base de donnée dans le Cloud
Une base de données dans le Cloud est une base de données qui a été optimisée ou construite pour un environnement virtualisé, soit dans un Cloud hybride, soit dans un Cloud public ou privé. Les bases de données dans le Cloud offrent des avantages tels que la possibilité de payer la capacité de stockage et la bande passante à l’utilisation, et elles offrent une évolutivité à la demande, ainsi qu’une haute disponibilité.
Une base de données Cloud donne également aux entreprises la possibilité de prendre en charge des applications professionnelles dans le cadre d’un déploiement de logiciel-service.
Base de donnée NoSQL
Les bases de données NoSQL sont utiles pour les grands ensembles de données distribuées.
Les bases de données NoSQL sont efficaces pour les problèmes de performance des données volumineuses que les bases de données relationnelles ne sont pas conçues pour résoudre. Elles sont particulièrement efficaces lorsqu’une organisation doit analyser de grandes quantités de données non structurées ou de données stockées sur plusieurs serveurs virtuels dans le Cloud.
Base de donnée orientée objet
Les éléments créés à l’aide de langages de programmation orientés objet sont souvent stockés dans des bases de données relationnelles, mais les bases de données orientées objet sont bien adaptées à ces éléments.
Une base de données orientée objet est organisée autour d’objets plutôt que d’actions, et de données plutôt que de logique. Par exemple, un enregistrement multimédia dans une base de données relationnelle peut être un objet de données définissable, par opposition à une valeur alphanumérique.
Base de donnée graphique
Une base de données orientée graphes, ou base de données de graphes, est un type de base de données NoSQL qui utilise la théorie des graphes pour stocker, cartographier et interroger les relations. Les bases de données de graphes sont essentiellement des collections de nœuds et d’arêtes, où chaque nœud représente une entité, et chaque arête représente une connexion entre les nœuds.
Les bases de données de graphes sont de plus en plus populaires pour l’analyse des interconnexions. Par exemple, les entreprises peuvent utiliser une base de données de graphes pour extraire des données sur les clients des médias sociaux.
Les bases de données de graphes utilisent souvent SPARQL, un langage de programmation déclaratif et un protocole pour l’analyse des bases de données de graphes. SPARQL a la capacité d’effectuer toutes les analyses que SQL peut effectuer, en plus il peut être utilisé pour l’analyse sémantique, l’examen des relations. Cela le rend utile pour effectuer des analyses sur des ensembles de données qui comportent à la fois des données structurées et non structurées. SPARQL permet aux utilisateurs d’effectuer des analyses sur les informations stockées dans une base de données relationnelle, ainsi que sur les relations d’amitié (FOAF), le PageRank et le chemin le plus court.