Deduplica
La deduplica dei dati (o deduplicazione dei dati / duplicate check) consiste nell’identificazione di dati doppi, o presunti tali, all’interno di un archivio informativo, a causa di inesattezze o incoerenze di vario tipo, con successiva possibilità di ridurre i "doppioni" alla loro forma univoca.
Egon è un software appositamente costruito al fine di normalizzare database anagrafici e deduplicare i dati presenti, selezionando criteri come nome, cognome, ragione sociale, partita iva, indirizzo, ecc., con individuazione di ogni probabile ridondanza.
INDIVIDUA SUBITO I DATI DOPPI NEL TUO DATABASE!
Ad ogni elemento, preventivamente normalizzato, viene assegnato un codice univoco, il "match code", il quale, analizzato e valutato mediante determinate regole, consente di identificare e segnalare in output i record doppi con elevata affidabilità.
Il modulo è in grado di trattare e confrontare nella stessa elaborazione più archivi, anche con tracciati record disomogenei tra loro.
Se hai bisogno di effettuare un’analisi del tuo database al fine di eliminare i dati duplicati oppure necessiti di uno strumento che si integri alla tua applicazione e supporti l’inserimento dati segnalando eventuali immissioni non necessarie (in quanto il record inserito è già archiviato), prova EGON.
Deduplicare perché?
La qualità dei dati necessita di una corretta gestione di ogni aspetto e i dati doppi costituiscono un problema, sia a livello di interazione uomo-applicativo, sia a livello di spese impreviste dovute per esempio ad inutili invii doppi di materiali pubblicitari o semplici comunicazioni ufficiali alla medesima ditta, cosa tra l’altro nociva a livello di immagine aziendale pubblica.
CONTROLLA ADESSO SE ESISTONO DATI DOPPI NEL TUO DATABASE!
L’utilizzo, a scopi di corrispondenza, di database anagrafici corretti, completi, normalizzati e privi di dati duplicati è sinonimo di professionalità, ecco perché integrare una soluzione software di normalizzazione automatica consente notevoli benefici. Utile in caso di fusione di più archivi, la deduplica è applicabile a persone fisiche e giuridiche e sfrutta la metodologia “match-codifica” che permette di: eliminare doppi, individuare nuclei familiari, arricchire i dati interni:
- correlazione dati
- integrazione delle anagrafi, casellari, indirizzi ed archivi
- accorpamento informazioni e documenti di un soggetto
- gestione posizione unica del soggetto e attribuzione PIN
- gestione informazioni duplicate
Match code e duplicate check
L’output della deduplica è il match-code, una stringa di caratteri o numeri in cui vengono riportati o codificati parte degli elementi che compongono l’anagrafica (cognome o ragione sociale, nome, sesso, località, CAP, DUG, via, numero civico). Il match-code permette di identificare gruppi di record doppi con elevata affidabilità di riconoscimento e ottime performance.
Operativamente, Duplicate Check consiste in:
- deduplica anagrafica
- gestione parametrica chiavi e regole
- gestione probabili doppi
- gestione gruppi
- creazione match-code/chiavi fonetiche
- abbinamento anagrafico
- gestione relazioni e legami
- merge tra archivi

