Deduplikacja danych I deduplikacja adresy

Deduplikacja danych (deduplikowanie danych/ duplicate check) polega na identyfikacji podwójnych danych, lub danych, o których myślimy, że są podwójne i zaistniałych wewnątrz archiwum informacyjnego na skutek niedokładności lub niespójności różnego rodzaju, z sukcesywną możliwością zredukowania „duplikatów” do jednoznacznej formy.

Twoja baza danych zawiera jakieś duplikaty?

Jeśli musisz wyeliminować zduplikowane dane w bazie danych swojej firmy lub potrzebujesz narzędzia do integracji z aplikacją i sprawdzania wprowadzania danych poprzez zaznaczanie wszelkich zbędne lub zduplikowanych danych wejściowych (gdy rekord jest już archiwizowany), wypróbuj EGON.

DLACZEGO DEDUPLIKACJA?

Wysoka jakość danych wymaga odpowiedniego zarządzania, ponieważ podwójne dane przysparzają wiele problemów, zarówno na poziomie interakcji człowiek-aplikacja, jak i ze względu na nieprzewidziane wydatki spowodowane niepotrzebnymi, podwójnymi spedycjami materiałów reklamowych lub oficjalnych komunikatów wysyłanych do tej samej firmy, szkodząc tym samym publicznemu wizerunkowi firmy.

Stosowanie w celach korespondencji baz danych poprawnych, kompletnych, znormalizowanych i bez duplikatów, jest synonimem profesjonalizmu. Dlatego też ich zintegrowanie z oprogramowaniem zapewniającym automatyczną normalizację zapewnia niezliczone korzyści. Software ten, użyteczny w przypadku fuzji większej ilości archiwów i deduplikacji, może być stosowany zarówno do osób fizycznych jak i podmiotów prawnych, oraz wykorzystuję metodę „match-coding”, która umożliwia eliminację duplikatów, indywidualizację grup i uzupełnienia istniejących danych:

 • korelacja danych
 • integracja danych osobowych, pól, adresów i archiwów
 • łączenie informacji i dokumentów dotyczących tego samego podmiotu
 • zarządzanie jednoznaczną pozycją podmiotu i przypisanie kodu PIN
 • zarządzanie informacjami podwójnymi
Deduplikacja danych i deduplikacja adresy

Egon  to oprogramowanie  stworzone w celu normalizacji baz danych oraz  deduplikowania  obecnych danych, przy zastosowaniu kryteriów takich jak imię, nazwisko, nazwa, numer VAT, adres, itd. oraz wykrywaniu wszystkich możliwych redundancji.

Po znormalizowaniu dowolnego elementu, zostanie mu przypisany jednoznaczny kod, tak zwany „match code“, który, po jego przeanalizowaniu i określeniu za pomocą odpowiednich reguł, umożliwia identyfikację i zaznaczenie z wysokim stopniem dokładności w pliku wyjściowym wszystkich podwójnych rekordów.

Moduł opracowuje i porównuje podczas jednej operacji większą ilość archiwów, również o niejednolitej formie.
Jeżeli musisz wykonać analizę twojej bazy danych w celu wyeliminowania duplikatów, lub jeśli potrzebujesz narzędzia, które zintegruje się z twoją aplikacją i ułatwi wprowadzanie danych sygnalizując ewentualne niepotrzebne wpisy (ponieważ wpisywany rekord został już uprzednio zarchiwizowany) then wypróbuj EGON.

MATCH CODE I KONTROLA DUPLIKATÓW

Wyjściowym rezultatem deduplikacji jest   match-code, ciąg znaków lub cyfr zawierających lub kodujących elementy tworzące rekord (nazwisko lub nazwa firmy, imię, płeć, miejscowość, kod pocztowy, ulicę, numer lokalu). Match-code umożliwia, z niesamowicie wysoką dokładnością i wydajnością, identyfikację grup lub podwójnych rekordów.

W praktyce,  Duplicate Check  obejmuje:

 • deduplikację danych osobowych
 • zarządzanie parametryczne kluczami i regułami
 • zarządzanie możliwymi duplikatami
 • zarządzanie grupami
 • tworzenie match-code/kluczy fonetycznych
 • łączenie danych osobowych
 • zarządzanie relacjami i powiązaniami
 • scalanie archiwów

ODKRYJ JAK NASZE ZARZĄDZAJĄCE DANYMI OPROGRAMOWANIE MOŻE POMÓC CI ROZWINĄĆ TWOJĄ FIRMĘ!