데이터베이스 25

릴레이션 분해(decomposition)과 제1정규형

01. 릴레이션 분해란? 릴레이션 분해는 하나의 릴레이션을 두 개 이상의 릴레이션으로 나누는 것입니다. 릴레이션을 분해하면 중복이 감소되고 갱신 이상이 줄어드는 장점이 있는 반면에, 바람직하지 않은 문제들을 포함하여 몇 가지 잠재적인 문제들을 야기할 수 있습니다. 첫째, 일부 질의들의 수행 시간이 길어집니다. 릴레이션이 분해되기 전에는 조인이 필요 없는 질의가 분해 후에는 조인을 필요로 하는 질의로 바뀔 수 있습니다. 둘째, 분해된 릴레이션들을 사용하여 원래 릴레이션을 재구성하지 못할 수 있습니다. 셋째, 어떤 종속성을 검사하기 위해서는 분해된 릴레이션들의 조인이 필요할 수 있습니다. 따라서 이런 잠재적인 문제와 중복성 감소 간의 균형을 고려해야 합니다. 다음의 학생 릴레이션은 함수적 종속성들이 만족됩니..

함수적 종속성에 대해 알고계신가요?

01. 함수적 종속성 함수적 종속성(FD : Functional Dependency)의 개념은 정규화 이론의 핵심이라고 할 수 있습니다. 함수적 종속성은 관계 데이터 모델에서 가장 중요한 제약조건의 하나입니다. 함수적 종속성에 관한 지식은 갱신 이상과 중복을 제거하기 위해 데이터베이스 스키마를 설계하는 데 필수적입니다. ER 다이어그램이 모든 함수적 종속성들을 나타내지는 못합니다. 함수적 종속성은 릴레이션의 애트리뷰트들의 의미로부터 결정됩니다. 함수적 종속성은 릴레이션 스키마에 대한 주장이지 릴레이션의 특정 인스턴스에 대한 주장이 아닙니다. 릴레이션의 상태에 포함이 될 수 있는 모든 가능한 투플에 대한 제약조건입니다. 함수적 종속성은 릴레이션의 가능한 모든 인스턴스들이 만족해야 합니다. 어떤 릴레이션 인..

릴레이션 정규화에 대해서

데이터베이스를 설계하여 생성하는 업무를 맡았다고 가정해봅시다. 좋은 데이터베이스를 설계하는 것은 매우 중요한 작업입니다. 부주의한 데이터베이스 설계는 제어할 수 없는 데이터 중복을 야기하여 여러 가지 갱신 이상(update anomaly)을 유발합니다. 그렇다면 어떻게 좋은 데이터베이스를 설계해야 할까요? 데이터베이스에 어떤 릴레이션을 생성해야 할까요? 각 릴레이션에 어떤 애트리뷰트를 만들어야 할까요? 01. 릴레이션의 정규화 좋은 관계 데이터베이스 스키마를 설계하는 목적은 ➀ 정보의 중복과 갱신 이상이 생기지 않도록 하면서, ➁ 정보의 손실을 막고 실세계를 훌륭하게 나타내며 ➂ 애트리뷰트들 간의 관계가 잘 표현되는 것을 보장하며, ➃ 어떤 무결성 제약조건의 시행을 간단하게 하여 ➄ 효율성 측면을 고려하..

물리적 데이터베이스 설계에 대하여(5)

07. 인덱스 선정 지침과 데이터베이스 튜닝 성능 목표를 만족시키기 위해서는 가장 중요한 질의들과 이들의 수행 빈도, 가장 중요한 갱신들과 이들의 수행 빈도, 이와 같은 질의와 갱신들에 대한 바람직한 성능들을 고려하여 인덱스를 선정해야 합니다. 어떤 애트리뷰트에 인덱스를 정의할 것인가를 결정하는 것이 항상 쉬운 일은 아니며 이는 경험을 필요로 합니다. 인덱스 선정은 물리적 데이터베이스 설계자에게 가장 중요한 엄무 중의 하나이면서 가장 어려운 작업입니다. 워크로드 내의 각 질의에 대해 이 질의가 어떤 릴레이션들을 접근하는가, 어떤 애트리뷰트들을 검색하는가, WHERE절의 선택/조인 조건에 어떤 애트리뷰트들이 포함되는가, 이 조건들의 선별력은 얼마인가 등을 고려해야 합니다. WHERE절의 선택/조인 조건에 ..

물리적 데이터베이스 설계에 대하여(3)

05. 단일 단계 인덱스란? 만일 파일에 대한 접근이 일괄 방식으로 순차 접근만 한다면 어떤 종류의 인덱스도 거의 불필요합니다. 인덱스 된 순차 파일은 인덱스를 통해서 임의의 레코드를 접근할 수 있는 파일입니다. 인덱스 자체가 파일을 의미하므로 '인덱스 파일'이라고 할 필요는 없습니다. 단일 단계 인덱스의 각 엔트리는 로 이루어집니다. 엔트리들은 탐색 키 값의 오름차순으로 정렬됩니다. 인덱스는 DBMS가 파일 내의 특정 레코드들을 빠르게 찾을 수 있도록 하는 데이터 구조이므로 인덱스를 통하여 질의를 수행하면 응답 시간이 향상됩니다. 디스크 접근 시간이 주기억 장치 접근 시간에 비해서 매우 크고 대부분의 데이터베이스 응용에서 디스크 접근을 많이 요구하므로, 인덱스를 통해 디스크 접근 횟수를 줄이면 데이터베..