Rapprochement des données
Règles de gestion et de survie des entités pour les processus ETL
L’un des objectifs principaux de la gestion des données de référence (MDM) est d’obtenir une source unique de vérité – une entité exacte à 100 % capturant toutes les informations pertinentes et nécessaires concernant un client, une ressource, un produit ou un service. Cependant, travailler avec plusieurs bases de données et des points de saisie disparates entraîne la création d’entités doubles à partir de saisies incomplètes, suscite des modifications au fil du temps et d’autres phénomènes similaires qui font de la création d’entités de référence un défi difficile.
MatchUp à la rescousse.
Construire une entité de référence
Les options de sélection d’une entité de référence qu’offre MatchUp sur SSIS et Pentaho permettent la sélection intelligente d’une entité de référence à partir d’un groupe de doublons afin de créer une version unique, précise et complète de chaque entité client.
MatchUp permet d’identifier la meilleure entité au sein d’un groupe préalablement rapproché sur la base de critères presque illimités, qui incluent notamment :
- Le score de qualité des données (choix de l’adresse, du nom, du numéro téléphone et/ou de l’adresse e-mail les plus précis)
- Dernière mise à jour
- Entité la plus complète
- Expression personnalisée
Ressources utiles