La deduplica consente di individuare ed eliminare anagrafiche doppie o valutare le presunte tali, selezionando criteri come nome, cognome, ragione sociale, partita iva, indirizzo, ecc.
Utile in caso di unione di più anagrafiche, la deduplica è applicabile a persone fisiche e giuridiche e sfrutta la metodologia “match-codifica” che permette di: eliminare doppi, individuare nuclei familiari, arricchire i dati interni.
L’output della deduplica è il match-code, una stringa di caratteri o numeri in cui vengono riportati o codificati parte degli elementi che compongono l’anagrafica (cognome o ragione sociale, nome, sesso, località, CAP, DUG, via, numero civico). Il match-code permette di identificare gruppi di record doppi con elevata affidabilità di riconoscimento e ottime performance.
Il modulo è in grado di trattare e confrontare nella stessa elaborazione più archivi, anche con tracciati record disomogenei tra loro.
Operativamente, Duplicate Check consiste in:
- Deduplica anagrafica
- Gestione parametrica chiavi e regole
- Gestione probabili doppi
- Gestione gruppi
- Creazione match-code/chiavi fonetiche
- Abbinamento anagrafico
- Gestione relazioni e legami
- Merge tra archivi