Deduplicação de dados e endereços postais: EGON

A deduplicação de dados (ou duplicate check) permite identificar as duplicidades, ou supostas duplicidades, de um arquivo de informações provocadas por inexatidões ou incoerências de diferentes tipos, sendo possível, em seguida, reduzir as “repetições” à sua forma unívoca.

IDENTIFIQUE JÁ AS DUPLICIDADES NO SEU BANCO DE DADOS!

deduplicação de dados e endereços

Egon é um software realizado especialmente com a finalidade de normalizar bancos de dados de registros e deduplicar os dados presentes, selecionando critérios como nome, sobrenome, nome da empresa, número de CPJ, endereço, etc., com a identificação de qualquer provável redundância.

A cada elemento previamente normalizado é atribuído um código unívoco, o “match code“, que, ao ser analisado e avaliado segundo determinadas regras, permite identificar e indicar em saída as duplicidades com alta confiabilidade.

O módulo é capaz de tratar e comparar durante a mesma elaboração diversos arquivos, mesmo se houver rastros de registros não homogêneos.

Se você precisa analisar o seu banco de dados para eliminar as duplicidades ou se necessita um instrumento que possa ser integrado à sua aplicação como suporte para a entrada de dados, identificando eventuais entradas desnecessárias (pois o registro inserido já foi arquivado), teste EGON.

Deduplicação de dados, por quê?

A qualidade de dados  exige um gerenciamento correto de todos os aspectos e os dados duplos constituem um problema, tanto na interação homem-aplicativo, como em relação a despesas imprevistas decorrentes, por exemplo, no campo específico da duplicidade de endereços, de inúteis envios duplos de materiais publicitários ou simples comunicados oficiais à mesma firma, o que, aliás, é prejudicial à imagem pública empresarial.

CONTATE-NOS E PEÇA JÁ UMA DEMO GRÁTIS PARA A DEDUPLICAÇÃO DOS SEUS DADOS!

O uso para a correspondência de bancos de dados corretos, completos, normalizados e sem duplicidades é sinônimo de profissionalismo e, por este motivo, integrar uma solução software de normalização automática traz benefícios significativos. A deduplicação, útil em caso de fusão de arquivos, pode ser aplicada para pessoas físicas e jurídicas e utiliza a método “match-code”, que permite: eliminar duplicidades, identificar famílias, enriquecer os dados internos:

  • correlação de dados
  • integração de censos, registros, endereços e arquivos
  • unificação de informações e documentos de um sujeito
  • gestão de uma posição unívoca do sujeito e atribuição de PIN
  • gestão de informações repetidas

MATCH-CODE E DUPLICATE CHECK

A saída da deduplicação é um match-code, uma cadeia de caracteres ou números que indica ou codifica parte dos elementos que formam o registro (sobrenome ou nome da empresa, nome, sexo, município, CEP, toponímia, rua, número). O match-code permite identificar grupos de registros repetidos com alta confiabilidade de reconhecimento e um ótimo rendimento.

Do ponto de vista operacional, o Duplicate Check consiste em:

  • deduplicação de registro
  • gestão de parâmetros-chave e regras
  • gestão de prováveis duplicidades
  • gestão de grupos
  • criação de match-code/chaves fonéticas
  • combinação de dados
  • gestão de relações e ligações
  • fusão entre arquivos
  • deduplicação de dados pessoais

Share on Google+0Tweet about this on TwitterShare on LinkedIn0