IT

SQLD, SQLP 시험과목1: 데이터 모델링의 이해 - 4

紫紅 2018. 8. 15. 19:24
반응형

 이 글은 한국데이터진흥원에서 2013년도에 출판한 「SQL 전문가 가이드」의 한국어 번역입니다(한국데이터진흥원에서 외국어로 출판했다는 의미가 아니라, 한국어를 화성에서 배우신 분들이 쓴 책이기에 번역이 필요하다고 판단했습니다. 더 이상 이 책을 보며 고통받는 이들이 없길 바라는 마음을 담아 한한번역 시작합니다).

 직역이 아닌 의역이 다수이므로 'SQL에 대한 이해'를 돕는 용도로만 사용하시길 바랍니다(주관식 시험은 토씨하나 틀리면 가차없이 감점시킨다는 얘기가 있습니다. 특히 주의하시길). 또한 실제 의미와 맞지 않는 부분이 있을 수 있는데, 댓글로 친절하게 지적해주신다면 감사하겠습니다.


4. 데이터 모델링의 3단계 진행


 데이터 모델은 데이터베이스 설계서란 목표를 갖고 있다. 현실세계에서 데이터베이스까지 만들어지는 과정은 추상화 정도에 따라 '개념적 데이터 모델', '논리적 데이터 모델', '물리적 데이터 모델'로 정리할 수 있다.





 개념적 데이터 모델은 추상화 수준이 높고 업무중심적이며 포괄적인 수준이다. 참고로 EA(Enterprise Architecture)기반의 전사적 데이터 모델링을 전개할 때는 더 상위 수준인 개괄적 데이터 모델링을 먼저 수행한 후, 업무 영역에 따른 개념적 데이터 모델링을 수행한다.

 엔터티(Entity)중심의 상위수준의 데이터 모델이 완성되면 업무중심의 구체화된 데이터 모델을 만드는데, 이것을 논리적 데이터 모델링이라고 한다. 논리적인 데이터 모델링 이후, 데이터베이스의 저장구조를 고려한 방식이 물리적 데이터 모델링이다.


정리, 요약한 표는 다음과 같다.


데이터 모델링 

내용 

수준 

개념적 데이터 모델링 

업무중심적이며 포괄적인 수준의 모델링. 전사적 데이터 모델링, EA수립 시 많이 이용

↑추상적


↓구체적

 논리적 데이터 모델링

 시스템으로 구축하고자하는 업무에 대해 key, 속성, 관계 등을 정확하게 표현, 재사용성이 높음

 물리적 데이터 모델링

실제로 데이터베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계 




가. 개념적 데이터 모델링(Conceptual Data Modeling)


개념적 데이터베이스 설계(개념적 데이터 모델링)는 엔터티(조직, 사용자의 데이터 요구사항)를 찾고 분석하는 데서 시작한다. 이 과정은 어떤 자료가 중요한지, 어떤 자료가 유지되어야 하는지를 결정하는 일도 포함한다. 즉, 핵심 엔터티와 그들 간의 관계를 발견하고, 그것을 표현하기 위해서 ERD(Entity-Relationship Diagram)를 생성하는 단계이다. ERD는 조직과 DB사용자에게 어떠한 데이터가 중요한지 나타내기 위해서 사용된다. 데이터 모델링 과정이 전 조직에 걸쳐 이루어진다면, 그것은 전사적 데이터 모델(Enterprise Data Model)이라고 불린다.


 개념 데이터 모델을 통해 조직의 데이터 요구를 공식화하는 것은 두 가지 기능이 있다.


 1) 사용자와 시스템 개발자가 데이터 요구 사항을 발견하는 것

 2) 현 시스템이 어떻게 변형되어야 하는가를 이해하는데 유용


개념 데이터 모델은 추상적이기에 상위 문제의 구조화를 도와주며, 사용자와 개발자가 시스템 기능에 대해서 논의할 수 있는 기반을 형성한다. 또 고립된(Stand Alone) 시스템도 추상적 모델링을 통해서 보다 쉽게 표현, 설명된다.




나. 논리적 데이터 모델링(Logical Data Modeling)


 논리 데이터 모델은 물리적인 스키마 설계를 하기 바로 전 단계의 상태로 즉, 데이터 모델링이 최조적으로 완료된 상태라고 정의할 수 있다. 데이터베이스 설계 프로세스의 Input으로써 비즈니스 정보의 논리적 구조, 규칙을 명확하게 표현하는 작업이 이 단계(논리적 데이터 모델링)에 해당된다.

 논리적 데이터 모델링은 데이터 모델링 중 가장 핵심적인 단계로, 이 단계의 핵심은 다음과 같다. 누가, 어떻게 데이터에 엑세스하는지와 이 엑세스의 전산화와는 별개로 비즈니스 데이터에 존재하는 사실들을 인식하여 기록하는 것이다.

 이 단계에서 수행하는 또 한 가지의 중요한 활동은 정규화이다. 정규화는 논리 데이터 모델 상세화 과정의 대표적인 활동으로, 논리 데이터 모델의 일관성을 확보하고 중복을 제거하여 속성들이 가장 적절한 엔터티에 배치되도록 함으로써 보다 높은 데이터 품질을 얻는데 목적이 있다. 논리 데이터 모델의 상세화는 식별자 확정, 정규화, M:M관계 해소, 참조 무결성 규칙 정의 등이 있다. 추가적으로 이력 관리에 대한 전략을 정의하여 이를 논리 데이터 모델에 반영함으로써 데이터 모델링을 완료하게 된다.




다. 물리적 데이터 모델링(Physical Data Modeling)


 데이터베이스 설계 과정의 세 번째 단계인 물리 데이터 모델링은 논리 데이터 모델이 데이터 저장소로써 어떻게 컴퓨터 하드웨어에 표현도리 것인가를 다룬다. 데이터가 물리적으로 어떻게 저장될 것인가에 대한 정의를 물리적 스키마라고 한다. 이 단계에서 결정되는 것은 테이블, 칼럼 등으로 표현되는 물리적인 저장구조와 사용될 저장 장치, 자료를 추출하기 위해 사용될 접근 방법 등이 있다. 계층적 데이터베이스 관리 시스템 환경에서는 데이터베이스 관리자가 물리적 스키마를 설계하고 구현하기 위해서 보다 많은 시간을 투자하여야 한다.



 실무에선 보통 개념/논리적 데이터 모델링을 한꺼번에 수행하여 논리적인 데이터 모델링으로 수행하는 경우가 대부분이다. 프로젝트 생명주기에 따른 일반적인 데이터 모델링은 다음과 같이 수행된다.



다음과 같이 수행되는 건 다음 장인 '5. 프로젝트 생명주기(Life Cycle)에서 데이터 모델링'에서 보겠습니다.

반응형