data warehouse

Définition : Data Warehouse

Véritable mystère conspirationniste pour certains, « super ordinateur central » ou « méga serveur » pour les autres, les Data Warehouse sont des banques de données. Ces entrepôts virtuels stockent des renseignements destinés à être exploités plus tard. Découvrez davantage ces compilateurs d’informations qui enregistrent les moindres détails sur le quotidien des consommateurs.

Qu’est-ce qu’une Data Warehouse ?

Une Data Warehouse est une structure informatique suffisamment performante pour emmagasiner une importante quantité de données. Ce sont généralement des renseignements récoltés dans la relation client stockées en interne à l’entreprise ou dans un datacenter. Plus tard, les informations compilées pourront être analysées. Les intéressés (entrepreneurs, annonceurs, décideurs en tout genre) obtiennent des réponses à des requêtes précises. Les statistiques et autres connaissances quantifiées sont indispensables pour la prise de décision. Ils constituent le fonds de commerce des acteurs du Business Intelligence, c’est-à-dire tous ceux qui travaillent pour proposer une meilleure compréhension du marché.

La base de données relationnelle reste l’exemple le plus courant. Les renseignements en rapport avec les clients sont recueillis par un outil d’extraction. Ces informations compilées sont transférées puis transformées dans un système dit ETL. Les opérateurs du data mining emploient également des programmes pour le traitement analytique (OLAP). Ils sont accessibles à distance pour les entreprises ou toutes personnes intéressées par leur exploitation. De toutes les manières, ce sont des renseignements classés et hiérarchisés. Les recherches peuvent se faire selon un sujet précis : type de produit, profils clients, etc. Il est également possible d’avoir une vue d’ensemble avec des données synthétiques.

Pourquoi les entrepôts de données sont-ils indispensables ?

L’implémentation d’une data warehouse demande un important budget. Ces entrepôts de données sont de véritables mines d’informations pour les entreprises. Les responsables marketing des grandes marques se servent des outils de type Online Analyticial Processing (OLAP) pour guider leur stratégie. Les marques y voient également une manière de mesurer le succès de leurs différentes campagnes de communication. Le retour sur les habitudes de consommation donne une idée de l’efficacité du réseau de distribution. Les entrepreneurs pourront par la suite mieux orienter leurs croissances. Le système profite même aux conseils d’administration et aux actionnaires qui liront des synthèses.

Une Data Warehouse permet de mesurer, mais surtout d’améliorer les performances d’une entreprise B2C. Les données compilées suffisent pour rectifier les erreurs dans les campagnes publicitaires. Les communicants et le personnel de front office ne sont pas les seuls concernés. Les informations obtenues permettent d’optimiser l’organisation au niveau de la logistique. Les services recherche et développement pourront aussi s’inspirer des réactions des consommateurs pour concevoir de meilleurs produits.

Un entrepôt de données emmagasine des renseignements issus de sources multiples. L’universalité de l’outil numérique permet de connaître les préférences des consommateurs à l’autre bout de la planète. Encore mieux, les entreprises qui savent exploiter les datas gardent une longueur d’avance sur les autres. Elles pourront anticiper les tendances en observant des indices. Ce sont souvent des signaux discrets explorés par les algorithmes, mais également avec le flair d’un bon entrepreneur.

Quels avantages les Data Warehouses offrent-ils ?

Les Data Warehouses procurent de nombreux avantages. Ils ont le mérite d’exister depuis 3 décennies et de rendre service aux décideurs économiques. Ces plateformes intéressent les ingénieurs informatiques, mais également les acteurs dans la grande distribution, le luxe, l’hôtellerie, la télécommunication et bien d’autres domaines. Par ailleurs, ces centres digitaux comprennent deux volets distincts. D’un côté, il y a tous les outils de recueil d’information. C’est la partie où les informaticiens relèvent divers challenges techniques. De l’autre, les programmes pour l’analyse qui intéressent un public plus large. Chaque corps de métier tire profit de ce système 2 en 1.

Un entrepôt de données constitue une source de renseignements à part entière. Distinct des processus en place, il n’alourdit pas le fonctionnement interne d’une société. Les employés n’auront pas à remplir des formulaires et les clients sont épargnés des sondages récurrents. De plus, les informations stockées dans un Data Warehouse sont spécifiques. Les usagers peuvent les exploiter en lançant une requête précise. Les données sont continuellement mises à jour. Puis, elles sont orientées sujet. Cela signifie que les chiffres et les résultats obtenus sont en rapport direct avec un produit ou un client en particulier, sans être nominatifs.

Qu’est-ce qui différencie les entrepôts virtuels d’autres serveurs ?

Pour les non-initiés, un Data Warehouse peut facilement être confondu à un serveur ou d’autres centres informatiques. L’inventeur de cette structure digitale, William H. Inmon propose de la distinguer par quatre caractéristiques spécifiques.

  • Un Data Warehouse doit être orienté sujet. Cela signifie que la requête est concentrée sur une thématique précise. À titre d’exemple, les renseignements analysés se rapportent uniquement sur les de ventes d’une entreprise. Les données chiffrées concernent le chiffre d’affaires et les meilleurs produits.
  • Le système est intégré. Il gère les doublons de noms et les différences de format en tout genre. Les opérateurs proposent d’assembler des données issues de multiples sources dans un modèle établi. Cette compilation permet de résoudre des problèmes tels que les incohérences sur les unités de mesure utilisées entre deux pays distincts.
  • Les renseignements emmagasinés sont stables. Toutes les informations entrées dans la Warehouse sont factuelles et non-volatiles. Si à une date D, 1000 pièces d’un produit X sont vendues, ce chiffre reste le même dans 10 ans. L’utilisateur dispose ainsi de données authentiques. Leur analyse permet d’aboutir à des conclusions fiables.
  • Les Data Warehouses stockent des renseignements qui vont être mis à jour. De nouvelles informations vont épaissir les autres et permettent d’actualiser la compilation. Les systèmes OLTP servent à anticiper les tendances du futur, mais établissent surtout la situation en temps réel.

Quelles sont les différentes solutions de gestion de données ?

Les entrepôts de données sont déclinés en 4 grandes catégories. En effet, chaque opérateur peut modifier sa structure en fonction des utilisateurs (entreprises) qu’il vise.

  • Les SGBD relationnels sont les Data Warehouse les plus connus. Mis au point par des éditeurs de logiciels tels que IBM, Oracle ou Microsoft, ce sont des outils standards auxquels les usagers peuvent ajouter des personnalisations. De manière générale, ce type de central permet d’observer les informations sur les activités de l’entreprise. Le but est de corriger les anomalies opérationnelles.
  • Pour leur part, les SGBD spécialisés sont programmés pour tenir compte du fonctionnement des entreprises utilisatrices. Ils prennent en charge les workloads, c’est-à-dire des technicités propres à l’usager. Des groupes informatiques tels que HP ou SAP se sont focalisés dans ce segment du marché. La base de données peut être déployée pour toute la société (EDW) ou uniquement pour un département (Data Mart).
  • Avec les Data Warehouses Appliances, les sociétés clientes disposent de solutions de compilation et d’analyse de données clé en main. Parmi les prestataires actifs dans ce domaine, Teradata et Oracle sont les plus recommandés. Ils suggèrent des logiciels sur mesure, mais également un entrepôt virtuel suffisamment grand pour garder une quantité d’information phénoménale. L’interface utilisateur est conçue pour une manipulation intuitive.
  • La quatrième catégorie n’est autre que le Cloud. Le système est accessible aux entreprises clientes via internet. Faisant partie de la famille des XaaS ou logiciels à utiliser à distance, cet outil en ligne offre l’avantage d’une dématérialisation totale. Ce secteur est dominé par Microsoft, IBM, mais le groupe Amazon garde aussi sa part. Des vendeurs tels que Actian et Pivotal sont dans la course. Ils essaient de se distinguer des grands éditeurs informatiques en proposant des systèmes hybrides.

Bonus: Data Warehouse versus Data Lake

Data Warehouse Data Lake
Désignation C’est une banque de données principalement destinée aux entreprises. Il s’agit d’un espace de stockage tous azimuts, dédié aux datas scientists et responsables informatiques.
Création Les Data Warehouses existent depuis 30 ans. Les Data Lakes sont récents.
Utilité Un Data Warehouse compile des données au sein d’une entreprise ou en extérieur. L’analyse des informations aide pour la décision. Un Data Lake propose de garder les données brutes dans leur format original pour une extraction et exploitation ultérieure.
Format d’entreposage Les Data Warehouses accueillent exclusivement des données structurées. Les informations suivent un modèle. Les Data Lakes stockent des données brutes, mais supportent également les renseignements structurés.
Type de traitement Schema-on-write : un programme de collecte fait en sorte que les renseignements soient compilables. Ils suivent un format donné. Schema-on-read : l’information est gardée dans son jus sans la moindre modification.
Coût de fonctionnement En interne, offshore ou via le Cloud, une banque de données revient chère à une entreprise. Le coût dépend du volume, mais également du prix de la licence. Il faut un logiciel professionnel dédié et un PC performant. La sauvegarde des données sur Data Lake coûte le minimum. Pour cause, le système utilise des logiciels open source. L’investissement sur un matériel informatique professionnel reste facultatif.
Sécurité Après 30 ans d’existence, les SGBD professionnelles offrent une confidentialité optimale. Les Data Lakes sont en cours de maturation. Chaque faille reste encore à découvrir et corriger.