À trois mois de l’entrée en vigueur de la GDPR, toutes les entreprises cherchent à se conformer à ce règlement européen sur la protection des données personnelles. Talend, leader mondial en Big Data, vous explique comment y parvenir.
Dans un monde où la quantité de données à gérer est de plus en plus importante, les entreprises doivent bientôt être en mesure de les traiter à travers des pratiques formalisées de gestion. Le but étant de tenir compte du respect de la vie privée des citoyens de l’Union Européenne. En d’autres termes, chaque nouveau service digital utilisant des données personnelles devra désormais être capable d’en assurer la protection grâce notamment à l’entretien d’un inventaire global.
Pour cela, les entreprises doivent à la fois élire ou recruter un délégué à la protection des données (DPO) mais également se doter d’une solution capable de faciliter cette adaptation à la nouvelle règlementation GDPR. Pour ce second aspect, Talend apporte son expertise pour faire face aux cinq piliers de la norme européenne.
Stockage des données
Talend assure la collecte, l’exploitation et le traitement des données. Interfaçable sur la plateforme Big Data de Talend, ces données pourront être harmonisées, nettoyées, protégées, gouvernées, partagées et auditées en toute sécurité dans un data lake.
Les entreprises gagneront ainsi en visibilité et pourront optimiser la gouvernance, la qualité et le stewardship des données à leur point d’origine grâce au MDM (Master Data Management) de Talend. De plus, les data lake permettront de stocker et faire correspondre les données issues de différentes sources/contextes afin de disposer d’une vue à 360°.
Classification et traçabilité des données
Créer une cartographie des données a toute son importance. La plateforme Big Data de Talend le permet grâce à une étroite intégration avec les environnements Apache Atlas et Cloudera Navigation. L’historique des flux des données est ainsi consultable et met en évidence l’origine et la destination de celles-ci.
D’autre part, Metadata Manager de Talend peut étendre cette vue de bout en bout, à tout système, bien au-delà du data lake. Par conséquent, chaque employé, administrateur ou auditeur est capable d’identifier les données concernées par la GDPR sur base d’un glossaire.
Anonymisation et pseudonymisation
Les techniques de masquage permettent de mettre certaines applications hors du champ de contrôle de la GDPR. Ainsi, certaines données sensibles pourraient être accessibles depuis un système en particulier (CRM), mais cachées lorsqu’elles sont utilisées à des fins d’analyse, de développement ou de test.
Ce concept de masquage de données (data masking) peut s’accompagner d’un brassage de données (data shuffling) à partir de l’outil Data Quality de Talend. Le brassage consistant en un mélange de données de façon aléatoire afin de dissimuler les identités, tandis que les valeurs pertinentes restent à leur place. De cette manière, la vie privée des individus concernés est protégée et contrôlée à n’importe quel étape du flux.
Exploitation et certification en libre-service
La délégation d’autorité d’un expert (délégué à la protection des données ou data steward) vers un utilisateur métier est non-négligeable. Ces derniers sont souvent les mieux placés pour connaître le niveau de mise à jour des données ou encore détecter la preuve d’un consentement.
Pour que toute personne, dans les différents départements de l’organisation, puisse gérer l’utilisation des données en toute conformité, Talend met à disposition des applications en libre-service telles que Data Preparation et Data Stewardship.
Partage et portabilité des données
Dans le cadre du droit à l’oubli, tout client ou contact doit pouvoir accéder, rectifier, supprimer ou même récupérer ses données personnelles au format électronique.
L’outil Data Preparation de Talend permet de récupérer ces données au travers des applications qui les utilisent, pour ensuite créer un fichier de données exportable (au format CSV) et transférable. Data Services de Talend prend en compte des services de données en temps réel via une API standard afin que le client ou contact puisse consulter, rectifier ou supprimer les données qui le concernent.
On remarque donc qu’au-delà de toute protection juridique et d’établissement de règles ou processus, il est crucial d’automatiser les contrôles et les chemins d’accès au sujet des données privées. Mettre en place une plateforme basée sur les data lake est un des points majeurs dans les stratégies de conformité à la GDPR.
https://www.talend.com/blog/2017/12/01/getting-ready-gdpr-5-key-takeaways-data-2020-emea/