Rapprochement des données
Identifiez et éliminez rapidement les doublons
En moyenne, une base de données contient 8 à 10 % de doublons. Ils entraînent des gaspillages et des inefficacités et nuisent à votre capacité à obtenir une vision unique et précise du client.
Melissa est la solution de rapprochement et de dédoublonnage la plus puissante et la plus précise du marché et permet de lutter contre le problème des entités doubles. Ce qui la distingue des autres est sa capacité d’analyse intelligente permettant de comprendre et d’analyser les différents composants d’adresses nationales et internationales. En combinant une connaissance approfondie des formats d’adresse internationaux et une maîtrise des techniques avancées de correspondance approximative, MatchUp vous donne la possibilité d’identifier et de fusionner/supprimer même les entités doubles les plus difficiles à repérer.
- Éliminez les doublons et encombrements qui empêchent d’avoir une vue claire de vos clients
- Augmentez la précision de votre base de données, pour gagner du temps et de l’argent
- Réduisez les frais d’affranchissement et d’envoi en éliminant les doublons grâce à une technologie de rapprochement avancée
Comment fonctionne MatchUp
MatchUp utilise un matchcode pour déterminer si deux entités doivent être considérées comme des doublons. MatchUp utilise un matchcode prédéfini ou un matchcode créé par vous à l’aide de l’éditeur de matchcode.
Les composants de matchcode suivants (types de données) peuvent être utilisés pour identifier les doublons : +
- Préfixe
- Prénom
- Deuxième prénom
- Nom
- Suffixe
- Genre
- Prénom/Surnom
- Deuxième prénom/Surnom
- Département/Titre
- Entreprise
- Acronyme de l’entreprise
- Numéro
- Pré-adresse de la rue
- Nom de la rue
- Suffixe de la rue
- Post-adresse de la rue
- Boîte postale
- Nom secondaire de la rue
- Adresse
- Ville
- État / Province
- ZIP9
- ZIP5
- ZIP+4®
- Code postal
- Pays
- Téléphone / Télécopieur
- Adresse e-mail
- Numéro de carte de crédit
- Date
- Numérique
- Proximité
- Identifiant général
Correspondance approximative
MatchUp combine l’expertise de Melissa dans le domaine des données de contact avec plus de 20 algorithmes de correspondance approximative qui permettent de rapprocher des entités similaires et de dédupliquer rapidement votre base de données.
MatchUp utilise les algorithmes de correspondance approximative suivants pour identifier les entités doubles dont la correspondance n’est pas exacte : +
- Phonetex
- Soundex
- Containment
- Frequency
- Fast Near
- Accurate Near
- Frequency Near
- UTF-8 Near
- Vowels Only
- Consonants Only
- Alphas Only
- Numerics Only
- MD Keyboard
- Jaro
- Jaro-Winkler
- n-Gram
- Needleman-Wunch
- Dice’s Coefficient
- Smith-Waterman-Gotoh
- Jaccard Similarity Coefficient
- Overlap Coefficient
- Longest Common Substring
- Double MetaPhone
Fusion globale / purge et déduplication
L’édition mondiale de MatchUp prend en charge 12 pays, dont le Canada, l’Allemagne, le Royaume-Uni et l’Australie. La déduplication avancée de MatchUp prend en compte les équivalents diacritiques des caractères latins et interprète les mots clés identiques mais orthographiés différemment (par exemple : Allemagne et DEU).
Scénarios de correspondance uniques
MatchUp possède des attributs uniques qui peuvent être utilisés pour aider à identifier les doublons de façon intéressante.
1. Survie permettant la création d’une entité de référence
+Matchup peut sélectionner les meilleurs éléments au sein de plusieurs entités et les faire survivre à la consolidation, ce qui s’avère idéal pour créer des entités de référence donnant une vue unique du client. Disponible pour Microsoft SQL Server Integration Services (SSIS) et Pentaho PDI.
2. Correspondance de proximité
+L’algorithme de distance breveté de MatchUp utilise les coordonnées latitude-longitude et des seuils de proximité pour identifier les entités doubles géographiquement proches les unes des autres. Par exemple, à l’aide d’attributs de localisation, MatchUp peut détecter des entités correspondant à différentes adresses (par exemple, une entreprise présentant deux portes d’entrée différentes) mais dont la distance correspond à une valeur spécifiée.
3. Foyers
+MatchUp peut identifier et consolider les entités des membres d’un même foyer afin de mieux comprendre les relations, le cycle de vie et les besoins des clients. Vous pouvez également utiliser MatchUp pour regrouper plusieurs comptes d’entreprises au sein de « familles d’entreprises » afin d’obtenir des informations et de mieux évaluer la relation commerciale dans sa totalité. Le foyer peut également être utilisé pour éliminer les envois multiples inutiles au même foyer et réduire ainsi les coûts d’impression, de production et d’affranchissement inutiles.
Trois manières de dédupliquer vos données
MatchUp propose trois méthodes de fonctionnement (ou méthodes de mises en lien d’entités) :
1. Dédoublonnage en lecture/écriture
+Compare les entités dans une ou plusieurs bases de données à la fois. Chaque groupe unique contiendra une entité qui recevra un statut de « sortie » ; les autres entités correspondantes reçoivent un statut « doublon ». Idéal pour la mise en correspondance de bases de données entières en une seule fois.
2. Déduplication incrémentale
+Permet une correspondance en temps réel qui compare chaque entité à son arrivée (à partir d’un formulaire web ou d’un centre d’appels, par exemple) par rapport à la base de données principale existante. Si l’entité entrante n’est pas un doublon, elle peut être ajoutée.
3. Déduplication hybride
+Fournit une combinaison des deux méthodes citées et permet de personnaliser le processus pour rapprocher une entité entrante d’un petit groupe de correspondances potentielles. Avec la déduplication hybride, vous pouvez stocker les clés de correspondance de manière propriétaire. Idéal pour la saisie de données en temps réel ou pour le traitement de listes entières par lots.
Ressources utiles