Deduplicación de direcciones Y Deduplicación de datos

La deduplicación de los datos y de las direcciones (o duplicate check) consiste en identificar los datos repetidos, o supuestamente repetidos, en un archivo informativo como consecuencia de inexactitudes o incoherencias de distintos tipos, con la posterior posibilidad de reducir las “palabras repetidas” a su forma unívoca.

¡DEDUPLICA DE DATOS Y DIRECCIONES REPETIDOS EN TU BASE DE DATOS!

deduplicacion

Egon es un software creado específicamente para normalizar bases de datos anagráficasdeduplicar los datos existentes seleccionando criterios como el nombre, los apellidos, la razón social, el C.I.F., la dirección, etc., con la detección de cualquier posible redundancia.

 

 

 

 

A cada elemento, previamente normalizado, se le asigna un código unívoco, el “match code“, que, tras ser analizado y evaluado mediante determinadas reglas, permite identificar y señalar los registros repetidos con un gran nivel de fiabilidad.

 

 

La unidad es capaz de tratar y comparar en la misma elaboración varios archivos incluso con trazados de registros no homogéneos entre sí.

Si necesitas analizar tu base de datos para eliminar los datos duplicados o una herramienta que se integre en tu aplicación y soporte la introducción de datos señalando las posibles introducciones innecesarias (dado que el registro introducido ya está archivado), prueba EGON.

Software de deduplicación de datos

La calidad de datos requiere que se gestione correctamente cada aspecto y los datos duplicados representan un problema, tanto a nivel de interacción hombre-aplicación como a nivel de gastos imprevistos debidos por ejemplo, en el campo específico de la deduplicación de direcciones, a envíos inútiles duplicados de material publicitario o simples comunicaciones oficiales a la misma empresa, algo que entre otras cosas es perjudicial a nivel de imagen de empresa pública.

¡COMPRUEBA YA SI HAY DATOS REPETIDOS EN TU BASE DE DATOS!

La utilización, con fines de correspondencia, de bases de datos anagráficas correctas, completas, normalizadas y sin datos duplicados es sinónimo de profesionalidad, por eso integrar una solución software de normalización automática conlleva notables beneficios. La deduplicación, útil en caso de fusión de distintos archivos, puede aplicarse a personas físicas y jurídicas y cuenta con la metodología “código de concordancia” que permite: eliminar datos duplicados, localizar núcleos familiares y enriquecer los datos internos:

  • correlación de datos
  • integración de los censos, los registros, las direcciones y los archivos
  • unificación de información y documentos de un sujeto
  • gestión de la posición única del sujeto y atribución del PIN
  • gestión de la información duplicada

Match code Y duplicate check:

El resultado de la deduplicación es el match-code, una serie de caracteres o números en los que se indican o codifican parte de los elementos que forman el registro (apellidos o razón social, nombre, sexo, localidad, C.P., DUG, calle, número de la calle). El match-code permite identificar grupos de registros repetidos con una gran fiabilidad de reconocimiento y óptimos rendimientos.

Operativamente Duplicate Check consiste en:

  • deduplicación de datos
  • gestión paramétrica de claves y reglaso
  • gestión de probables datos duplicadoso
  • gestión de gruposo
  • creación de match-code/claves fonéticaso
  • combinación de datoso
  • gestión de relaciones y vínculoso
  • fusión entre archivos
  • deduplicación de los datos personales
Share on Google+0Tweet about this on TwitterShare on LinkedIn0