IT

SQLD,SQLP 시험과목1: 데이터 모델링의 이해 - 3

紫紅 2018. 8. 14. 15:03
반응형

 이 글은 한국데이터진흥원에서 2013년도에 출판한 「SQL 전문가 가이드」의 한국어 번역입니다(한국데이터진흥원에서 외국어로 출판했다는 의미가 아니라, 한국어를 화성에서 배우신 분들이 쓴 책이기에 번역이 필요하다고 판단했습니다. 더 이상 이 책을 보며 고통받는 이들이 없길 바라는 마음을 담아 한한번역 시작합니다).

 직역이 아닌 의역이 다수이므로 'SQL에 대한 이해'를 돕는 용도로만 사용하시길 바랍니다(주관식 시험은 토씨하나 틀리면 가차없이 감점시킨다는 얘기가 있습니다. 특히 주의하시길). 또한 실제 의미와 맞지 않는 부분이 있을 수 있는데, 댓글로 친절하게 지적해주신다면 감사하겠습니다.




3. 데이터 모델링의 중요성 및 유의점

가. 파급효과(Leverage)
 시스템 구축이 완성되어 가는 시점에서 애플리케이션, 대규모의 데이터 이행 등의 각종의 테스트가 진행된다. 데이터 모델링이 잘못 되었다면, 이를 변경해야하고, 시스템 구축 프로젝트의 큰 위험 요소이다. 따라서 데이터 설계가 다른 어떤 설계보다 중요하다.



나. 복잡한 정보 요구사항의 간결한 표현(Conciseness)

  데이터 모델은 구축할 시스템의 정보 요구사항과 한계를 가장 명확하고 간결하게 표현할 수 있는 도구이다. 정보 요구사항을 파악할 때, 수많은 페이지의 기능적 요구사항을 일일히 찾아보는 것보다, 간결하게 그려져 있는 데이터 모델을 리뷰하는 것이 효율적이다.



다. 데이터 품질(Data Quality)

 데이터는 누적, 시간이 지날수록 활용가치가 오르는데, 이 데이터의 신빙성이 떨어진다면 어떨까? 데이터의 품질문제는 초기에는 인지하지 못하다가, 충분히 쌓인 데이터를 활용할 때 문제가 대두된다. 따라서 처음부터 데이터 모델링을 할 때 다음사항을 유의해야한다.


1) 중복(Diplication)

 본질적으로 같은 데이터를 여러 곳에 저장하지 않도록 하여야 한다. 권한 부여, 갱신 상황 등의 상황에서 문제가 발생한다.


2) 비유연성(Infelxibility)

 사용 프로세스의 관점에서 데이터 모델링을 하게 된다면, 프로세스가 바뀔 때마다 수정하여야 하는 어려움이 있다. 따라서 사용 프로세스와 별개로 데이터 모델링을 하여야만, 프로세스의 변화나 다른 환경에서의 사용에 대해 추가 업무가 발생하지 않는다.


3) 비일관성(Inconsistency)

 데이터의 중복이 없더라도 비일관성은 발생한다. 예를 들어 신용 상태에 대한 갱신 없이 고객의 납부 이력 정보를 갱신하는 것이다. 개발자가 다른 데이터와 모순된다는 고려 없이 일련의 데이터를 수정할 수 있기 때문이다. 데이터 모델링을 할 때 데이터와 데이터간 상호 연관 관계에 대한 명확한 정의는 이러한 위험을 사전에 예방할 수 있도록 해준다.


---------------------------------------------------------

다음 글은 '4. 데이터 모델링의 3단계 진행'입니다. 감사합니다.

반응형