해시 조인 HASH
DB CAFE
touch_app
디비카페는 정보공유를 목적으로 비영리적으로 운영하고 있습니다. (SNS: twitter@dbcafe_kr)1 HASH 조인(HASH JOIN)[편집]
해시 함수를 이용하여 조직 테이블(데이터 작은쪽)에 해시테이블을 만들고 실적집계 테이블(데이터 많은쪽)을 탐색하면서 조인.
- Hash Join에서는 작은 테이블을 먼저 접근하는 것이 성능이 좋음(해시테이블을 빨리 build 하기때문).
이후 큰 테이블을 접근하여 해시 함수를 사용해서 순차적으로 해시 테이블로 탐색 한다.
- 대량 데이터를 처리하는 배치성 프로그램에 적합한 조인 방식.
1.1 HASH JOIN 예시[편집]
SELECT /*+ USE_HASH(B) */
A.조직명,A.조직코드,SUM(B.실적),...
FROM 조직 A
, 실적집계 B
WHERE A.조직코드 = B.조직코드
AND A.사업부 = 'ㅇ사업부서명'
AND B.집계년월 = '201908'
GROUP BY A.조직명,A.조직코드
(설명)
1. 조직 테이블(A)에서 사업부가 ‘ㅇ사업부서명’조회 후, 조인 컬럼인 조직코드를 해시 함수로 분류한 다음, 해시테이블 을 생성. (Build Input , 해시 함수를 이용해 해시 테이블 구성)
2. 실적집계 테이블(B) 에서 집계년월이 ‘201908’를 조회 후, 조인 컬럼인 조직코드를 해시 함수로 변환 후 해시 테이블로 순차 적으로 접근한다. (Probe Input 해시 함수를 통하여 해시 테이블을 탐색)
- 조회 조건 컬럼인 A.사업부 컬럼과 B.집계년월 컬럼의 인덱스를 사용하여 성능을 개선하고 ,
- 조인 컬럼인 A.조직코드 = B.조직코는 인덱스가 존재하더라도 사용되지 않는다.