[데이터베이스] 스타 스키마 및 스노우 플레이크 스키마

 

스타 스키마의 개념

 

스타 스키마 개념도
스타 스키마의 개념
  •  조인 스키마(Join Schema)라고도 하며, 데이터 웨어하우스의 스키마 중 가장 단순• 전통적인 관계형 데이터베이스를 통해 다차원 데이터베이스 기능을 구현
  • 사실 테이블은 보통 제3정규형으로 모델링하며, 차원 테이블들은 보통 비정규화된 제 2정규형으로 모델링하는 것이 일반적
  • 단일 사실 테이블(Fact Table)을 중심으로 한 다수의 차원 테이블(Dimensional Table)들로 구성


스타 스키마의 구성요소

 
  1. 팩트 테이블(Fact Table):
    • 비즈니스 프로세스와 관련된 측정 지표(measures)를 포함하는 중심 테이블
    • 일반적으로 숫자형 데이터(sales, profit, cost 등)가 저장됨
    • 팩트 테이블은 여러 개의 차원 테이블과 연결됨
  2. 차원 테이블(Dimension Table):
    • 팩트 테이블의 측정 지표를 설명하는 속성 데이터를 포함하는 테이블
    • 일반적으로 텍스트형 데이터(product, customer, time 등)가 저장됨
    • 팩트 테이블과 1:N 관계로 연결됨
장, 단점
  • 장점: 이해하기 쉽고 계층구조 정의가 용이 물리적인 조인수가 줄어 들음
     
  • 단점: 차원 테이블들의 비정규화에 따른 데이터 중복으로 인해 테이블로 데이터를 적재할 때 상대적으로 많은 시간이 소요
예시
  • 팩트 테이블: 주문 정보(order_fact)
  • 차원 테이블: 고객(customer_dim), 제품(product_dim), 시간(time_dim), 매장(store_dim) 등

 

스노우 플레이크 스키마

 

스타 스키마와 달리 차원 테이블을 제3정규형으로 정규화한 형태

• 장점 : 데이터의 중복이 제거돼, 데이터 적재 시 시간이 단축

• 단점 : 스타 스키마에 비해 구조의 복잡성이 증가하므로 조인 테이블의 갯수가 증가하고 쿼리 작성 난이도가 상승