드로우홀릭 더베이직
1. 개요
마스터 데이터가 잘못되어 있어, 이를 클렌징하는 프로젝트였습니다.
총 14개 서버, 36개 시스템, 6,550개의 테이블에 대해서 클렌징해야 하는 작지 않은 프로젝트였습니다.
예를 들자면, 마스터 데이터에 '삼성 전자'와 'Samsung Electronics'가 서로 다른 회사로 인식하는 상황이었고, 이 마스터 데이터를 참조하는 36개 시스템의 실적이 분리되어 잡히는 문제가 있었습니다.
본 프로젝트의 목표는 이러한 '삼성 전자'와 'Samsung Electronics'를 하나의 기업으로 시스템에 인식시키고, 이를 참조하는 목표 시스템에서도 실적이 통합되어 하나로 잡히도록 하는 것이었습니다.
2. 문제 해결
예를 들어, '삼성 전자', '(주)삼성 전자', '삼성 전자 주식회사' 등은 프로그래밍적으로 하나의 회사로 인식시킬 수 있었기 때문에 별 문제가 되지 않았습니다. 그러나, '삼성 전자'와 'Samsung Electronics'는 사람이 보면 같은 회사로 인식할 수 있지만, 컴퓨터는 동일한 회사로 인식할 수 있는 논리적 구조가 없었습니다. 그래서 별도의 '수작업 정제 툴'을 만들었습니다. 이 '수작업 정제 툴'을 이용하여 수작업을 최대한 간단하게 수행할 수 있었습니다.
실제 적용시, 문제가 발생하면 이전 상태로 되돌리기로 하는 준비를 마치고 실제 적용 작업을 수행하였는데, 다행히 별 문제 없이 작업이 끝났습니다.
3. 성과
이로 인하여 50만여 건 이상의 실적 자료가 통합되어, 보다 정확한 실적을 집계할 수 있게 되었습니다.
그림1. 테스트 결과서 |
그림2. 수작업 정제 도구 | |
---|---|---|
그림3. 최종 결과 |