Cloud

Définition Datawarehouse

Historique de Datawarehouse

Le Datawarehouse permet aux utilisateurs de comprendre et d’améliorer la performance de leur organisation. Le besoin d’entreposer les données a évolué à mesure que les systèmes informatiques devenaient plus complexes et qu’il fallait traiter des quantités croissantes d’information. Cependant, l’entreposage de données n’est pas une chose nouvelle.

Voici quelques événements clés dans l’évolution de Data Warehouse :

  • 1960- Dartmouth et General Mills, dans le cadre d’un projet de recherche conjoint, élaborent les termes dimensions et faits.
  • 1970- A Nielsen et IRI introduisent des datamarts dimensionnels pour la vente au détail.
  • 1983- Tera Data Corporation introduit un système de gestion de base de données spécialement conçu pour l’aide à la décision.

L’entreposage des données a commencé à la fin des années 1980 lorsque Paul Murphy et Barry Devlin, employés d’IBM, a mis au point le Business Data Warehouse.

Cependant, le vrai concept a été donné par Inmon Bill. Il était considéré comme le père de l’entrepôt de données. Il avait écrit sur une variété de sujets concernant la construction, l’utilisation et l’entretien de l’entrepôt et de l’usine d’information corporative.

Comment fonctionne Datawarehouse ?

Un entrepôt de données fonctionne comme un dépôt central où l’information provient d’une ou de plusieurs sources de données. Les données provenant du système transactionnel et d’autres bases de données relationnelles sont transférées dans un entrepôt de données.

Les données peuvent l’être :

  • Structuré
  • Semi-structuré
  • Données non structurées

Les données sont traitées, transformées et ingérées afin que les utilisateurs puissent accéder aux données traitées dans l’entrepôt de données grâce à des outils de Business Intelligence, des clients SQL et des tableurs. Un entrepôt de données fusionne les informations provenant de différentes sources en une base de données complète.

En fusionnant toutes ces informations en un seul endroit, une organisation peut analyser ses clients de manière plus globale. Cela permet de s’assurer qu’il a pris en compte toutes les informations disponibles. L’entreposage de données rend possible l’exploration de données. L’exploration de données est à la recherche de tendances dans les données qui pourraient mener à une augmentation des ventes et des profits.

 

Types d’entrepôts de données

Trois principaux types d’entrepôts de données sont :

  1. Entrepôt de données d’entreprise :

Enterprise Data Warehouse est un entrepôt centralisé. Il fournit un service d’aide à la décision à l’échelle de l’entreprise. Il offre une approche unifiée pour l’organisation et la représentation des données. Il permet également de classer les données selon le sujet et de donner accès aux données en fonction de ces divisions.

  1. Entrepôt de données opérationnelles :

Operational Data Store, également appelé ODS, n’est rien d’autre qu’un stockage de données nécessaire lorsque ni l’entrepôt de données ni les systèmes OLTP ne répondent aux besoins des organisations en matière de rapports. Dans ODS, l’entrepôt de données est rafraîchi en temps réel. Par conséquent, il est largement préféré pour les activités de routine comme le stockage des dossiers des employés.

  1. Data Mart :

Un data mart est un sous-ensemble de l’entrepôt de données. Il est spécialement conçu pour un secteur d’activité particulier, comme les ventes, les finances, les ventes ou les finances. Dans un data mart indépendant, les données peuvent être collectées directement auprès des sources.

 

Généralité de l’entrepôt de données

Auparavant, les organisations ont commencé à utiliser relativement simplement les DataWarehouse. Cependant, avec le temps, des utilisations plus sophistiquée de l’entreposage des données a commencé.

Voici les étapes générales d’utilisation de l’entrepôt de données :

1. Base de données opérationnelle hors ligne :

Dans cette étape, les données sont simplement copiées d’un système opérationnel vers un autre serveur. De cette façon, le chargement, le traitement et le reporting des données copiées n’ont pas d’impact sur les performances du système opérationnel.

2. Entrepôt de données hors ligne :

Les données de l’entrepôt de données sont régulièrement mises à jour à partir de la base de données opérationnelle. Les données de Datawarehouse sont cartographiées et transformées pour répondre aux objectifs de Datawarehouse.

3. Entrepôt de données en temps réel :

Dans cette étape, les entrepôts de données sont mis à jour chaque fois qu’une transaction a lieu dans la base de données opérationnelle. Par exemple, le système de réservation des compagnies aériennes ou ferroviaires.

4. Entrepôt de données intégré :

Dans cette étape, les entrepôts de données sont continuellement mis à jour lorsque le système opérationnel effectue une transaction. Le Datawarehouse génère ensuite des transactions qui sont renvoyées au système opérationnel.

Composants de l’entrepôt de données

Trois composantes des entrepôts de données sont :

  • Gestionnaire de charge : Le gestionnaire de charge est aussi appelé le composant frontal. Il effectue toutes les opérations associées à l’extraction et au chargement des données dans l’entrepôt. Ces opérations comprennent des transformations pour préparer les données à entrer dans l’entrepôt de données.
  • Directeur d’entrepôt : Le gestionnaire d’entrepôt effectue les opérations associées à la gestion des données dans l’entrepôt. Il effectue des opérations telles que l’analyse des données pour assurer la cohérence, la création d’index et de vues, la génération de dénormalisation et d’agrégations, la transformation et la fusion des données sources et l’archivage et la mise en grappes des données.
  • Gestionnaire de requêtes : Le gestionnaire de requêtes est également connu sous le nom de composant backend. Il effectue toutes les opérations liées à la gestion des requêtes des utilisateurs. Les opérations de ces composants de l’entrepôt de données sont des requêtes directes vers les tables appropriées pour planifier l’exécution des requêtes.

Outils d’accès pour les utilisateurs finaux :

Il est classé en cinq groupes différents :

  1. La déclaration des données
  2.  Outils d’interrogation
  3.  Outils de développement d’applications
  4.  Outils SIE
  5.  Outils OLAP et outils de data mining

Qui a besoin d’un entrepôt de données ?

L’entrepôt de données est nécessaire pour tous les types d’utilisateurs comme :

  • Les décideurs qui s’appuient sur une masse importante de données
  • Les utilisateurs qui utilisent des processus complexes et personnalisés pour obtenir de l’information à partir de sources de données multiples.
  • Il est également utilisé par les personnes qui veulent une technologie simple pour accéder aux données.
  • C’est également essentiel pour les personnes qui veulent une approche systématique pour prendre des décisions.
  • Si l’utilisateur veut des performances rapides sur une grande quantité de données, ce qui est une nécessité pour les rapports, les grilles ou les graphiques, alors Data warehouse s’avère utile.
  • L’entrepôt de données est une première étape si vous voulez découvrir des  » modèles cachés  » de flux de données et de regroupements.

À quoi sert un entrepôt de données ?

Voici, sont les secteurs les plus communs où l’entrepôt de données est utilisé :

Compagnie aérienne :
Dans le système des compagnies aériennes, il est utilisé à des fins d’exploitation comme l’affectation des équipages, l’analyse de la rentabilité des routes, la promotion des programmes de fidélisation, etc.

Banques :
Il est largement utilisé dans le secteur bancaire pour gérer efficacement les ressources disponibles sur le bureau. Peu de banques ont également utilisé pour l’étude de marché, l’analyse des performances du produit et des opérations.

Soins de santé :
Le secteur de la santé a également utilisé l’entrepôt de données pour élaborer des stratégies et prévoir les résultats, produire des rapports sur les traitements des patients, partager les données avec les compagnies d’assurance liées, les services d’aide médicale, etc.

Secteur public :
Dans le secteur public, l’entrepôt de données sert à la collecte de renseignements. Il aide les organismes gouvernementaux à tenir et à analyser les dossiers fiscaux et les dossiers de politique de santé de chaque individu.

Secteur de l’investissement et de l’assurance :
Dans ce secteur, les entrepôts servent principalement à analyser les modèles de données, les tendances des clients et à suivre les mouvements du marché.

Supply Chain:
Dans les chaînes de magasins de détail, l’entrepôt de données est largement utilisé pour la distribution et le marketing. Il permet également de suivre les articles, les habitudes d’achat des clients, les promotions et également utilisé pour déterminer la politique de prix.

Télécommunications :
Un entrepôt de données est utilisé dans ce secteur pour les promotions de produits, les décisions de vente et les décisions de distribution.

Industrie hôtelière :
Cette industrie utilise des services d’entreposage pour concevoir et estimer ses campagnes de publicité et de promotion là où elle veut cibler ses clients en fonction de leurs commentaires et de leurs habitudes de voyage.

 

Vous savez tout sur le Data Warehouse

Ecrire un commentaire