Was ist eine Dublettenprüfung?
Als Dublettenprüfung bezeichnet man die Identifizierung und Zusammenführung von doppelten Datensätzen (oder auch Duplikate). Dafür haben wir eigens über 20 Fuzzy-Matching-Algorithmen entwickelt.
Im Durchschnitt enthält eine Datenbank 8% - 10% Dubletten. Diese Duplikate führen zu Verschwendung und Unwirksamkeit, aber über anpassbare Kriterien in MatchUp® erhalten Sie eine einzige, exakte Sicht auf jeden Kunden.
Melissas MatchUp® ist die leistungsfähigste, genaueste und schnellste Lösung auf dem Markt, um das Problem der Dubletten in Dateien zu bekämpfen. Was es von den anderen unterscheidet, ist seine intelligente Analysefähigkeit, um die verschiedenen Komponenten von nationalen und internationalen Adressen zu verstehen und zu analysieren. Durch die Kombination von fundiertem Domainwissen über internationale Adressformate und fortschrittlichen Fuzzy-Matching-Techniken haben Sie mit MatchUp® die Möglichkeit, selbst die am schwierigsten zu erkennenden Dubletten zu identifizieren und zusammenzuführen.
Mit MatchUp® können Sie Dubletten in Ihren Datenbanken identifizieren und durch Zuordnungsregeln, sogenannte Matchchodes, herausfinden, ob die zu einem Haushalt, einem Unternehmen oder einer Organisation gehören. MatchUp® verwendet einen vordefinierten Matchcode oder einen, den Sie mit dem Matchcode-Editor selbst erstellt haben. Dieser Matchcode kann aus über 35 Komponenten beliebig kombiniert werden.
Zur Identifizierung von Dubletten stehen folgende Matchcode-Komponenten (Datentypen) zur Verfügung: +
MatchUp® kombiniert Melissas fundiertes Domainwissen über Kontaktdaten mit über 20 Fuzzy-Matching-Algorithmen, um ähnliche Datensätze abzugleichen und die Datenbank schnell zu entlasten.
MatchUp® verwendet die folgenden Fuzzy-Matching-Algorithmen, um "nicht genau übereinstimmende" Dubletten zu identifizieren: +
Die World Edition von MatchUp® unterstützt 12 Länder, darunter Kanada, Deutschland, Großbritannien und Australien. MatchUp's® fortgeschrittene Deduplizierung kann diakritische Gegenstücke zu lateinischen Zeichen erkennen und Schlüsselwörter interpretieren, die identisch sind, jedoch unterschiedlich geschrieben sind (z.B. Deutschland und DEU).
MatchUp® verfügt über einige einzigartige Attribute, mit deren Hilfe Dubletten auf interessante Weise identifiziert werden können.
1. Survivorship/Golden Record
+Automatisierte und intelligente Auswahl des “Golden Records” über die Bewertung der Datenqualität und andere Algorithmen. Verfügbar in Microsoft SQL Server Integration Services (SSIS) und Pentaho PDI.
2. Proximity Matching
+Der patentierte Distanz-Algorithmus von MatchUp® verwendet Breiten- und Längengrade, um Dubletten zu identifizieren, die räumlich nah beieinander liegen. Mithilfe von Standortattributen kann MatchUp® beispielsweise übereinstimmende Datensätze an verschiedenen Adressen (z.B. einem Unternehmen mit zwei verschiedenen Eingängen) erkennen und verlinkt diese Beziehung mit einer Toolbox von Fuzzy-Algorithmen und match thresholds.
3. Householding
+Wenn ein Kunde drei oder vier Kataloge von Ihnen an einem Tag erhält, weil ihn alle Erwachsenen in dem Haushalt auf Ihrer Website bestellt haben, hinterlässt dies einen schlechten Eindruck. Mit MatchUp® können Sie Datensätze in Ihren Datenbanken identifizieren, die zu einem Haushalt, einem Unternehmen oder einer Organisation gehören. Die Versandkosten reduzieren sich, denn überzählige Aussendungen werden hinfällig. MatchUp® führt mehrere Datensätze, die zu einem Empfänger gehören, in einen einzigen zusammen und gibt Ihnen die notwendigen Informationen, um den damit verknüpften Gesamtumsatz zu ermitteln.
1. Lesen/Schreiben
+Vergleicht Datensätze in einer oder mehreren Datenbanken gleichzeitig. Jede einzelne Gruppe erhält einen Datensatz, der einen „Output“-Status erhält. Die anderen passenden Datensätze erhalten einen „Dubletten“-Status. Eignet sich ideal für das Zusammenführen, Bereinigen und Unterdrücken bestehender Daten in der Stapelverarbeitung.
2. Inkrementelle Dublettenentfernung
+Vergleicht jeden eingehenden Datensatz mit einer Datenbank, die bereits verarbeitete Datensätze beinhaltet. Eignet sich ideal für die Dateneingabe in Echtzeit. Wenn der eingehende Datensatz neu ist, wird er der bestehenden Datenbank hinzugefügt.
3. Hybride Dublettenentfernung
+Gibt Ihnen die Flexibilität, den Prozess dann anzupassen, wenn in Ihrer Umgebung eine interne Schlüsselspeicherung oder kleinere Einheiten von Datensätzen verglichen werden müssen. Ideal für Dateneingabe in Echtzeit oder zur Stapelverarbeitung.
Für eine kostenlosen Test der Dublettenprüfung bitte einfach das Formular ausfüllen!
Als Dublettenprüfung bezeichnet man die Identifizierung und Zusammenführung von doppelten Datensätzen (oder auch Duplikate). Dafür haben wir eigens über 20 Fuzzy-Matching-Algorithmen entwickelt.
Die Dublettenlösung nennt sich MatchUp® und ist einfach in Ihr System integrierbar. Diese Lösung identifiziert Dubletten in Ihren Datenbanken und fügt diese, durch sogenannten Matchcodes (Zuordnungsregeln), zusammen. Sie haben die Möglichkeit einen vordefinierten Matchcode auszuwählen oder sich selbst einen zu erstellen. Dafür stehen Ihnen 35 Komponenten zur Verfügung. Außerdem gibt es eine erweiterte Technologie, die es ermöglicht Datensätze zu einem „Golden Record“ zu konsolidieren.
Die Dublettenprüfung können Sie ganz einfach, mit vorinstallierten Fuzzy-Algorithmen, on-premise implementieren. Die Lösung können Sie sowohl im Echtzeit-Modus als auch im Batch (Stapelverarbeitung) einsetzen. Alternativ können Sie uns Ihre Datei auch zur Verfügung stellen und wir bereinigen diese als Dienstleistung (Service Bureau) für Sie.
Die World Edition von MatchUp® unterstützt 12 Länder, darunter Kanada, Deutschland, Großbritannien und Australien. Eine Übersicht finden Sie hier.