본문 바로가기
Database

오라클 CLUSTER 테이블 사용법

by 굿센스굿 2024. 12. 4.
반응형


CLUSTER 테이블
은 Oracle Database에서 관련 데이터를 동일한 데이터 블록에 물리적으로 저장하여 성능을 최적화하는 기술입니다. 데이터를 논리적으로 그룹화하여 읽기 작업 속도를 개선하고 저장 공간을 효율적으로 사용하도록 설계되었습니다. 이번 글에서는 CLUSTER 테이블의 개념, 생성 방법, 사용 예제, 그리고 주의사항을 상세히 다룹니다.


1. CLUSTER 테이블이란?

CLUSTER는 여러 테이블의 데이터를 하나의 데이터 블록에 함께 저장하는 데이터 구조입니다. 공통 키 값을 기준으로 관련 데이터를 물리적으로 묶어 저장하므로, 조인(Join) 또는 조회(Query) 작업이 빈번한 경우 성능 향상 효과를 제공합니다.

  • 특징:
    • 공통 키를 기준으로 데이터 그룹화.
    • 데이터를 동일한 데이터 블록에 저장.
    • I/O 성능 개선.
    • 테이블별 데이터 저장 공간 감소.

2. CLUSTER와 일반 테이블 비교

항목 일반 테이블 CLUSTER 테이블

데이터 저장 방식 독립적으로 저장 공통 키 값에 따라 묶여 저장
조회 속도 조인 작업 시 느림 조인 작업 시 속도 향상
저장 공간 테이블별로 별도 공간 사용 공유된 클러스터 공간 사용
적합한 상황 독립적인 데이터가 많은 경우 관련 데이터가 많은 경우

3. CLUSTER 구성 요소

  1. Cluster: 클러스터 자체를 정의하는 객체.
  2. Cluster Key: 데이터를 그룹화하는 기준이 되는 열.
  3. Clustered Table: 클러스터에 포함된 테이블.

4. CLUSTER 테이블 생성 방법

CLUSTER 테이블을 생성하려면 먼저 클러스터를 정의한 후, 클러스터에 테이블을 생성해야 합니다.

1) 클러스터 생성

CREATE CLUSTER cluster_name (key_column_name datatype)
SIZE cluster_size;
  • cluster_name: 클러스터 이름.
  • key_column_name: 클러스터 키로 사용할 열.
  • cluster_size: 데이터 블록 크기.

2) 클러스터에 테이블 추가

CREATE TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
CLUSTER cluster_name (key_column_name);
  • CLUSTER cluster_name: 해당 테이블이 어떤 클러스터에 속하는지 지정.
  • key_column_name: 클러스터 키와 동일해야 함.

3) 클러스터 인덱스 생성

CREATE INDEX index_name ON CLUSTER cluster_name;
  • 클러스터 인덱스는 클러스터 키를 기준으로 데이터를 빠르게 검색할 수 있도록 지원.

5. 사용 예제

예제 1: 부서와 직원 테이블을 클러스터링

부서(departments)와 직원(employees) 테이블이 조인될 때 성능을 개선하기 위한 클러스터 테이블을 설정합니다.

1) 클러스터 생성

CREATE CLUSTER emp_dept_cluster (department_id NUMBER)
SIZE 1024;
  • department_id를 기준으로 클러스터링.
  • 데이터 블록 크기를 1024로 지정.

2) 클러스터 인덱스 생성

CREATE INDEX emp_dept_cluster_idx ON CLUSTER emp_dept_cluster;

3) 클러스터에 테이블 추가

CREATE TABLE departments (
    department_id NUMBER PRIMARY KEY,
    department_name VARCHAR2(50)
)
CLUSTER emp_dept_cluster (department_id);

CREATE TABLE employees (
    employee_id NUMBER PRIMARY KEY,
    employee_name VARCHAR2(50),
    department_id NUMBER REFERENCES departments(department_id)
)
CLUSTER emp_dept_cluster (department_id);
  • 두 테이블 모두 department_id를 기준으로 클러스터링됩니다.

4) 데이터 삽입

INSERT INTO departments VALUES (1, 'Sales');
INSERT INTO departments VALUES (2, 'HR');

INSERT INTO employees VALUES (101, 'John', 1);
INSERT INTO employees VALUES (102, 'Jane', 1);
INSERT INTO employees VALUES (201, 'Alice', 2);

예제 2: 클러스터를 활용한 조회 성능 테스트

클러스터링이 적용된 상태에서 다음과 같은 조회 쿼리를 실행하면 빠른 응답 속도를 경험할 수 있습니다.

SELECT e.employee_name, d.department_name
FROM employees e
JOIN departments d ON e.department_id = d.department_id
WHERE d.department_id = 1;

6. CLUSTER 테이블의 장점

  1. 조인 성능 향상:
    동일한 데이터 블록에 관련 데이터가 저장되므로, 조인 쿼리 실행 속도가 크게 향상됩니다.
  2. 저장 공간 효율성:
    공통 키를 기준으로 데이터가 그룹화되므로 불필요한 저장 공간 낭비가 줄어듭니다.
  3. 일관성 유지:
    관련 데이터를 동일한 데이터 블록에 저장하여 관리가 용이해집니다.

7. CLUSTER 테이블 사용 시 주의사항

  1. 클러스터 키 설계 중요성:
    클러스터 키를 잘못 설계하면 데이터 저장 및 조회 성능이 저하될 수 있습니다.
  2. 삽입/삭제 작업 속도:
    데이터의 삽입과 삭제 작업은 일반 테이블보다 느릴 수 있습니다. 이유는 데이터 블록의 그룹화 때문입니다.
  3. 데이터 용량 예측 필요:
    클러스터의 크기(SIZE)를 설정할 때 데이터 용량을 잘 예측해야 합니다.
  4. 소규모 데이터에 적합:
    대규모 데이터나 동적 데이터가 많은 경우, 클러스터 테이블의 이점이 줄어들 수 있습니다.

8. CLUSTER 테이블 활용 시나리오

  1. 고정된 관계 데이터:
    예를 들어, 부서와 직원처럼 항상 관계가 유지되는 테이블.
  2. 조인이 빈번한 데이터:
    조회 쿼리에서 항상 조인되는 테이블.
  3. 읽기 중심 시스템:
    읽기 작업이 많은 데이터베이스 환경에 적합.

결론

CLUSTER 테이블은 관계형 데이터베이스에서 데이터 간 관계가 강하고 조인 작업이 빈번한 경우 성능을 크게 향상시킬 수 있는 강력한 도구입니다. 하지만 클러스터 키 설계와 용량 설정을 신중히 해야 하며, 삽입/삭제 성능이 중요한 경우 대안적인 접근법도 고려해야 합니다. 실무에서 CLUSTER 테이블을 적절히 활용하여 데이터 저장과 조회의 효율성을 극대화해 보세요!

반응형