Déduplication des données – Déduplication des adresses

La déduplication des données et adresses (ou dédoublonnage des données / duplicate check) consiste en l’identification des doublons, effectifs ou présumés, à l’intérieur d’un fichier d’informations, à cause d’inexactitudes ou d’incohérences diverses avec la possibilité de réduire les “doublons” à leur forme univoque.

LOCALISEZ TOUT DE SUITE LES DOUBLONS DANS VOTRE BASE DE DONNÉES !

deduplication adressesEgon est un logiciel conçu spécifiquement pour normaliser les bases de données personnelles et dédupliquer les adresses et données présentes, en sélectionnant des critères tels que le prénom, le nom, la raison sociale, le numéro de TVA, l’adresse, etc. avec détection des redondances éventuelles.

Un code univoque, le “match code” analysé et évalué selon des règles spécifiques, est attribué à chaque élément, préalablement normalisé, qui permet d’identifier et de signaler en sortie les doublons avec une fiabilité élevée.

Le module permet de traiter et de confronter plusieurs fichiers dans la même élaboration, notamment avec des enregistrements hétérogènes.

Si vous devez analyser votre base de données afin d’éliminer les doublons ou si vous avez besoin d’un instrument qui s’intègre à votre application et qui supporte la saisie des données en signalant d’éventuelles saisies non nécessaires (étant donné que l’enregistrement saisi est déjà archivé), essayez EGON.

Déduplication des données et adresses, pourquoi ?

La qualité des données nécessite une gestion correcte de tous les aspects et les doublons représentent un problème, tant au niveau de l’interaction homme-application qu’au niveau des frais imprévisibles dus par exemple, dans le domaine spécifique de la dédoublonnage des adresses, à des envois doubles de matériel publicitaire ou des communications officielles de la même société, une chose nuisible pour l’image publique de l’entreprise.

VÉRIFIEZ TOUT DE SUITE S’IL EXISTE DES DOUBLONS DANS VOTRE BASE DE DONNÉES !

L’utilisation dans la correspondance de base de données correctes, complètes, normalisées et sans doublons est synonyme de professionnalisme ; voilà pourquoi intégrer un logiciel de normalisation automatique permet d’obtenir des bénéfices remarquables. Utile en cas de fusion de plusieurs fichiers, la déduplication est applicable aux personnes physiques et morales et elle exploite la méthodologie “match-codage” permettant d’éliminer les doublons, de localiser les groupes familiaux, d’enrichir les données internes :

  • corrélation des données
  • intégration des données personnelles, des registres, des adresses et des fichiers
  • regroupement des informations et des documents d’une personne
  • gestion de la position unique de la personne et attribution du PIN
  • gestion des doublons

MATCH CODE ET DUPLICATE CHECK

La sortie de la déduplication est le match-code, une chaîne de caractères ou de numéros où une partie des éléments qui composent les données personnelles (nom ou raison sociale, prénom, sexe, localité, Code Postal, DUG, rue, numéro) est indiquée ou codée. Le match-code permet d’identifier les groupes de doublons avec une fiabilité élevée de reconnaissance et d’excellentes performances.

Du point de vue opérationnel, Duplicate Check consiste en :

  • La déduplication des données personnelles
  • La gestion paramétrique des clés et des règles
  • La gestion des doublons éventuels
  • La gestion des groupes
  • La création de match-code/clés phonétiques
  • Le couplage des données personnelles
  • La gestion des relations et des liaisons
  • L’union des fichiers

Share on Google+0Tweet about this on TwitterShare on LinkedIn0