💕IT 공부하기 40

릴레이션 정규화에 대해서

데이터베이스를 설계하여 생성하는 업무를 맡았다고 가정해봅시다. 좋은 데이터베이스를 설계하는 것은 매우 중요한 작업입니다. 부주의한 데이터베이스 설계는 제어할 수 없는 데이터 중복을 야기하여 여러 가지 갱신 이상(update anomaly)을 유발합니다. 그렇다면 어떻게 좋은 데이터베이스를 설계해야 할까요? 데이터베이스에 어떤 릴레이션을 생성해야 할까요? 각 릴레이션에 어떤 애트리뷰트를 만들어야 할까요? 01. 릴레이션의 정규화 좋은 관계 데이터베이스 스키마를 설계하는 목적은 ➀ 정보의 중복과 갱신 이상이 생기지 않도록 하면서, ➁ 정보의 손실을 막고 실세계를 훌륭하게 나타내며 ➂ 애트리뷰트들 간의 관계가 잘 표현되는 것을 보장하며, ➃ 어떤 무결성 제약조건의 시행을 간단하게 하여 ➄ 효율성 측면을 고려하..

물리적 데이터베이스 설계에 대하여(5)

07. 인덱스 선정 지침과 데이터베이스 튜닝 성능 목표를 만족시키기 위해서는 가장 중요한 질의들과 이들의 수행 빈도, 가장 중요한 갱신들과 이들의 수행 빈도, 이와 같은 질의와 갱신들에 대한 바람직한 성능들을 고려하여 인덱스를 선정해야 합니다. 어떤 애트리뷰트에 인덱스를 정의할 것인가를 결정하는 것이 항상 쉬운 일은 아니며 이는 경험을 필요로 합니다. 인덱스 선정은 물리적 데이터베이스 설계자에게 가장 중요한 엄무 중의 하나이면서 가장 어려운 작업입니다. 워크로드 내의 각 질의에 대해 이 질의가 어떤 릴레이션들을 접근하는가, 어떤 애트리뷰트들을 검색하는가, WHERE절의 선택/조인 조건에 어떤 애트리뷰트들이 포함되는가, 이 조건들의 선별력은 얼마인가 등을 고려해야 합니다. WHERE절의 선택/조인 조건에 ..

물리적 데이터베이스 설계에 대하여(4)

06. 다단계 인덱스란? 단일 단계 인덱스 자체는 인덱스가 정의된 필드의 값에 따라 정렬된 파일로 볼 수 있습니다. 인덱스 자체가 클 경우에는 인덱스를 탐색하는 시간도 오래 걸릴 수 있습니다. 인덱스 엔트리를 탐색하는 시간을 줄이기 위해서는 단일 단계 인덱스를 디스크 상의 하나의 순서 파일로 간주하고, 단일 단계 인덱스에 대하여 다시 인덱스를 정의할 수 있습니다. 1단계 인덱스는 밀집 인덱스 또는 희소 인덱스 모두 가능하지만 2단계 이상의 인덱스는 희소 인덱스만 가능합니다. 원래는 인덱스를 1단계 인덱스라 하고 이 인덱스에 대하여 정의한 추가 인덱스를 2단계 인덱스라 합니다. 교재에 따라서는 새로 추가된 인덱스를 1단계, 기존의 인덱스를 2단계라고 부르기도 합니다. 다단계 인덱스는 가장 상위 단계의 모든..

물리적 데이터베이스 설계에 대하여(3)

05. 단일 단계 인덱스란? 만일 파일에 대한 접근이 일괄 방식으로 순차 접근만 한다면 어떤 종류의 인덱스도 거의 불필요합니다. 인덱스 된 순차 파일은 인덱스를 통해서 임의의 레코드를 접근할 수 있는 파일입니다. 인덱스 자체가 파일을 의미하므로 '인덱스 파일'이라고 할 필요는 없습니다. 단일 단계 인덱스의 각 엔트리는 로 이루어집니다. 엔트리들은 탐색 키 값의 오름차순으로 정렬됩니다. 인덱스는 DBMS가 파일 내의 특정 레코드들을 빠르게 찾을 수 있도록 하는 데이터 구조이므로 인덱스를 통하여 질의를 수행하면 응답 시간이 향상됩니다. 디스크 접근 시간이 주기억 장치 접근 시간에 비해서 매우 크고 대부분의 데이터베이스 응용에서 디스크 접근을 많이 요구하므로, 인덱스를 통해 디스크 접근 횟수를 줄이면 데이터베..

물리적 데이터베이스 설계에 대하여(2)

04. 파일 조직 파일 조직은 파일 내의 데이터를 보조 기억 장치에 블록과 레코드들로 배치하는 것입니다. 전형적인 파일 조직의 유형으로는 히프 파일(heap file), 순차 파일(sequential file), 인덱스 된 순차 파일(indexed sequential file), 직접 파일(hash file)등이 있습니다. ① 히프 파일(heap file) 히프 파일은 가장 단순한 파일 조직입니다. 일반적으로 레코드들이 삽입된 순서대로 파일에 저장됩니다. 일반적으로 새로 삽입되는 레코드는 파일의 가장 끝에 첨부됩니다. 따라서 삽입이 쉬우며 레코드들의 순서는 없습니다. 원하는 레코드를 찾기 위해서는 모든 레코드들을 순차적으로 접근해야 합니다. 삭제는 원하는 레코드를 찾은 후에 그 레코드를 삭제하고, 삭제된..