Dans la continuité de ses mises à jour de solutions semestrielles (les “Winter” et les “Summer”), Talend présente les nouveautés de sa dernière livraison Big Data qu’est la version 2.0 de Data Preparation.
Sortie en janvier dernier lors de la conférence Talend Connect à Paris, cette nouvelle version de Data Preparation consiste en une solution en libre-service permettant aux utilisateurs de nettoyer et d’analyser de grands volumes de données.
Mais par-dessus tout, elle offre une facilité d’usage de l’outil ainsi qu’une scalabilité élevée. D’une part, grâce à l’exploitation démocratisée des Big Data et, d’autre part, en supportant la technologie Apache Beam. Sans oublier pour autant les atouts de la version précédente que sont la puissance fonctionnelle, l’expérience utilisateur, la sécurité des accès, la connectivité et le respect des règles de gouvernance pour les DSI.
Démocratisation des données
Pour aider les entreprises à gérer des milliers de données, Talend offre des possibilités d’élargissement du champ d’action des utilisateurs métiers (marketing, finance, comptabilité, achats, etc). Pour mieux exploiter l’intelligence des Big Data stockées dans le data lake, les entreprises se voient capable de mettre à disposition de leurs utilisateurs métiers des “sanctioned big datasets” en libre-service. Et ce, grâce aux connecteurs HDFS (Hadoop File and Storage System) qui permettent d’exporter les fichiers de type CSV, Parquet, Avro et JSON.
Selon leurs accès et leurs droits de gestion, les utilisateurs métiers peuvent exploiter librement l’ensemble des données disponibles. De la visualisation au nettoyage, de la standardisation à la présentation et l’enrichissement de ces dernières. Avant de les analyser et les intégrer dans leurs applications de business intelligence.
L’autonomie des utilisateurs métiers évoluent donc grâce, notamment, aux fonctions d’auto-découverte des données, d’autodiagnostic de leur qualité et d’autosuggestion de fonctions de nettoyage des données.
A noter que cette deuxième version de Talend Data Preparation offre également la possibilité à chaque utilisateur métier de préparer et intégrer de manière uniforme des données issues de tout type de base de données (connecteur Java Database Connectivity), de toute application, de tout fichier Excel ou CSV reçu par mail ou stocké localement.
Langage métier automatisé
Dans la masse de données que possède une entreprise, on retrouve aussi bien les données de type standard (prénom, nom, pays, numéro de TVA) que des données plus spécifiques (numéro de clients, codes produits, etc).
Pour pouvoir travailler efficacement, Talend Data Preparation aide les entreprises à reconnaître la sémantique de ces données spécifiques, évitant ainsi les pertes de temps liées au traitement manuel.
Pour marquer cette adaptation à votre langage métier, l’outil Data Dictionary Service fait office de dictionnaire de données pré-configuré. Il analyse et définit les données, favorisant ainsi la reconnaissance automatisée de celles-ci.
Garantie de performance
En exploitant de grands volumes de données en temps réel, aussi variées soient-elles, les entreprises se voient obligées d’être performantes dans le traitement de celles-ci. Pour leur apporter ce soutien, la technologie Apache Beam de Talend permet aux entreprises de délivrer un service de préparation de données pérenne à leurs utilisateurs. Ce qui évite aux entreprises de devoir réécrire des applications en fonction de l’évolution des innovations à cours du temps, des migrations des systèmes vers le cloud ou des évolutions de scénarii d’intégration. Ce modèle de programmation unifié permet d’exécuter des pipelines de flux de données par lots ou en flux continu.
Par conséquent, les utilisateurs créent une seule fois leurs modèles de préparation de données et les exécutent depuis n’importe quelle plateforme et n’importe où sur des volumes de données. Quelle que soit la fréquence.
On constate que les entreprises se doivent de prendre de plus en plus de décisions cohérentes, dans un laps de temps court. Ces nouveaux apports de Talend ont clairement pour objectif de les aider dans leur quête d’agilité et de scalabilité, en leur permettant de revoir la manière dont elles traitent et interprètent leurs importants flux de données, ainsi que la manière dont elles y permettent l’accès, le partage et la collaboration.
Source: https://fr.talend.com/blog/2017/04/26/quelles-sont-les-nouveautes-dans-talend-data-preparation-20