Qu’est-ce que Data Fabric ?

Ces derniers mois, le terme « data fabric » a rejoint le lexique des mots à la mode en matière de data management et d’analyse. En fait, Gartner a récemment identifié le « data fabric » comme l’une des « 10 meilleures tendances technologiques en matière de données et d’analyse pour 2019 ». Comme pour tout nouveau terme technologique à la mode, vous vous demandez peut-être : « Qu’est-ce que le Data Fabric ? » et « Pourquoi en ai-je besoin ? »

En termes simples, un Data Fabric est un environnement unique constitué d’une architecture unifiée et de services ou technologies fonctionnant sur cette architecture, qui aide les organisations à gérer leurs données. Le but ultime de la Data Fabric est de maximiser la valeur de vos données et d’accélérer la transformation numérique.

L’objectif du Data Fabric
Considérez le Data Fabric comme une trame tendue sur un grand espace qui relie plusieurs lieux, types et sources de données, avec des méthodes pour accéder à ces données. Les données peuvent être traitées, gérées et stockées à mesure qu’elles se déplacent dans le Data Fabric. Les données peuvent également être accessibles ou partagées avec des applications internes et externes pour une grande variété de cas d’utilisation analytique et opérationnelle pour toutes les organisations – y compris des analyses avancées pour les prévisions, le développement de produits et l’optimisation des ventes et du marketing. Les objectifs sont nombreux : améliorer l’engagement des clients grâce à des applications et des interactions mobiles plus avancées, se conformer à la réglementation sur les données et optimiser les chaînes d’approvisionnement, pour n’en citer que quelques-uns.

Data Fabric

Bien sûr, le diable est dans les détails. Ce qui constitue exactement un Data Fabric diffère en fonction du rôle de chacun (analyste vs cadre vs ingénieur de données vs scientifique de données vs analyste de données d’entreprise). Mais le principe selon lequel un Data Fabric permet d’accéder, d’ingérer, d’intégrer et de partager des données dans un environnement de données distribuées est largement accepté. Plus précisément, un Data Fabric :

se connecte à n’importe quelle source de données via des connecteurs et des composants préemballés, éliminant ainsi le besoin de codage
Fournit des capacités d’ingestion et d’intégration de données – entre et parmi les sources de données ainsi que les applications
Prend en charge les cas d’utilisation de données par lots, en temps réel et en masse
Gère plusieurs environnements – Cloud sur site, hybride et multi-cloud – à la fois comme source de données et comme consommateur de données
Fournit des capacités intégrées de qualité, de préparation et de gouvernance des données, renforcées par l’automatisation accrue de l’apprentissage machine
Favorise le partage des données avec les parties prenantes internes et externes grâce au soutien de l’API
Les données sont un avantage concurrentiel pour chaque entreprise
Nous vivons une époque de changements sans précédent – des changements à tous les niveaux de l’entreprise et de l’innovation. Dans ce paradigme, les données sont le moteur de l’avantage concurrentiel de chaque entreprise pour qu’elle réussisse et prospère, et les organisations doivent fournir des données rapidement pour répondre aux besoins des entreprises et des clients. En fait, selon une récente étude de Forrester, les entreprises axées sur la connaissance connaissent une croissance annuelle moyenne de plus de 30 %.

Conscientes de ce fait, de plus en plus d’organisations tentent d’obtenir une valeur ajoutée de leurs données de diverses manières, notamment en créant de nouvelles sources de revenus et en réduisant les coûts grâce à l’efficacité opérationnelle. Cependant, avec la prédominance du Cloud et de l’Internet des objets, ainsi que le stockage et le traitement de plus en plus bon marché, les données ne sont plus liées aux data centers des entreprises. Il y a plus de données, plus de types de données, et elles se trouvent dans beaucoup plus d’endroits, ce qui les rend beaucoup plus difficiles à gérer.

Les défis de la gestion de vos données
Réussir dans cet environnement et devenir une organisation data-driven n’est pas facile. Il existe de nombreux obstacles sur le chemin qui mène au leadership numérique. À mesure que les organisations utilisent de plus en plus d’applications, leurs données deviennent de plus en plus cloisonnées et inaccessibles au-delà de leur portée initiale. Alors que les infrastructures et les systèmes existants ne font qu’aggraver le problème, les données peuvent être mises en silos lorsqu’on tente de migrer vers le Cloud. Il peut être particulièrement difficile de partager des données entre des données résidant sur différents Clouds publics (par exemple AWS et Azure) ou entre un Cloud public et un data center sur site, ou encore de stocker le tout dans un entrepôt de données dans le Cloud.

Aujourd’hui, une entreprise type possède des données dans plusieurs sites sur site ainsi que dans plusieurs Clouds publics et/ou privés. Les données sont à la fois structurées et non structurées et sont conservées dans une grande variété de formats – systèmes de fichiers, bases de données relationnelles, applications SaaS, etc. Et le traitement de ces données fait appel à une multitude de technologies, du traitement par lots ETL ou ELT à la saisie de données modifiées en passant par la diffusion en temps réel. Comme près des trois quarts des organisations (74 %) utilisent six outils d’intégration de données ou plus, il devient très difficile pour les organisations d’être agiles et d’ingérer, d’intégrer, d’analyser et de partager rapidement leurs données et d’intégrer de nouvelles sources de données.

Le problème ne fait que s’aggraver à mesure que la quantité et les sources de données continuent d’augmenter. En conséquence, les professionnels des données finissent par consacrer 75 % de leur temps à des tâches autres que l’analyse des données. Non seulement cela entrave considérablement la capacité des organisations à tirer le meilleur parti de leurs données en temps utile, mais c’est aussi une utilisation grossièrement inutile et improductive du temps de vos professionnels des données.

Outre les obstacles qui empêchent les organisations d’avoir un accès rapide aux données, il existe également une myriade de problèmes qui rendent difficile la fiabilité des données elles-mêmes. En fait, près de la moitié des données d’entreprise présentent des problèmes d’intégrité. Et il est dix fois plus coûteux d’effectuer un travail qui repose sur des données si les données sous-jacentes présentent des défauts.

Comment obtenir rapidement des données fiables
Data Fabric offre l’étendue des fonctionnalités nécessaires aux entreprises modernes data-driven dans un environnement unifié avec une architecture native qui leur permet de s’adapter aux changements plus rapidement avec une intégrité de données intégrée. Les différentiateurs uniques de Talend permettent d’offrir à la fois confiance et rapidité sans compromis forcé.

Téléchargez dès maintenant le Guide définitif des entrepôts de données et des lacs de données dans le Cloud.
Lire maintenant

Environnement unifié
Talend fournit un environnement unifié pour tous vos besoins afin de vous aider à transformer des données brutes en données fiables. Data Fabric élimine le besoin de multiples produits d’intégration de données, contrats et mécanismes de support. De la découverte et de l’ingestion, à l’intégration de données provenant de sources multiples, au nettoyage de ces données et à la garantie de leur intégrité, jusqu’à l’analyse et au partage des données avec les parties prenantes.

Génération de code natif
Talend génère du code optimisé en natif – en Java/Spark/SQL – en construisant des pipelines de données pour tirer parti de toutes les principales plateformes (telles que AWS, Azure ou Snowflake). Ceci, ainsi que les plus de 1 000 connecteurs et composants intégrés de Talend pour les applications et environnements de pointe, facilite le travail avec le code et la création de pipelines.

Sur site ou Cloud
De plus, Data Fabric est conçu pour fonctionner à la fois sur site et dans le Cloud. Exécutez Talend pour ingérer et intégrer des données provenant à la fois d’environnements de back-office sur site, tels qu’Oracle et SAP, et d’environnements cloud tels que AWS, Azure, Google Cloud ou Snowflake. Adoptez rapidement les nouvelles technologies basées sur le Cloud, comme les conteneurs avec Docker et Kubernetes, les analyses avancées avec Databricks, Qubole, Spark, et l’informatique sans serveur

Qualité et gouvernance des données envahissantes
Data Fabric a intégré la qualité des données à chaque étape de la gestion des données – que vous découvriez et inguérissiez des données, utilisiez Talend pour l’intendance des données et définissiez des rôles pour le nettoyage des données, ou que vous deviez tracer la lignée des données pour assurer la conformité et l’intégrité. Data Fabric est conçu pour permettre aux services informatiques et aux entreprises de collaborer et de partager des données grâce à la gestion de données en libre-service.

Maintenant que vous en savez plus sur ce qu’est un data fabric et comment il fonctionne, nous vous invitons à télécharger une version d’évaluation gratuite de Data Fabric et à voir ce que vos données peuvent réellement faire.