"해시 조인 HASH"의 두 판 사이의 차이
DB CAFE
(→HASH 조인(HASH JOIN)) |
(→HASH 조인(HASH JOIN)) |
||
10번째 줄: | 10번째 줄: | ||
이후 큰 테이블을 접근하여 해시 함수를 사용해서 순차적으로 해시 테이블로 탐색 한다. | 이후 큰 테이블을 접근하여 해시 함수를 사용해서 순차적으로 해시 테이블로 탐색 한다. | ||
* 대량 데이터를 처리하는 배치성 프로그램에 적합한 조인 방식. | * 대량 데이터를 처리하는 배치성 프로그램에 적합한 조인 방식. | ||
+ | ---- | ||
+ | === HASH 조인의 특징 === | ||
+ | * Inner루프로 Hash Area에 생성해둔 해시테이블을 이용한다는 것 외에 NL조인과 유사하다. | ||
+ | * 해시테이블 만들 때는 전체범위처리가 불가피하나, Prob Input을 스캔하는 단계는 부분범위 처리가능하다. | ||
+ | * 해시조인은 해시테이블이 PGA영역에 할당되므로, NL조인보다 빠르다. | ||
+ | * NL조인은 Outer테이블에서 읽히는 레코드마다 Inner쪽 테이블 버퍼캐시 탐색을 위해 래치획득을 반복하나, 해시조인은 래치 획득과정없이 PGA에서 빠르게 데이터를 탐색할 수 있다. | ||
+ | ==== HASH 조인 장점 ==== | ||
+ | * NL조인처럼 조인시 발생하는 Random엑세스 부하가 없다. | ||
+ | * 소트머지조인처럼 조인전에 양쪽 집합을 정렬해야 하는 부담이 없다. | ||
− | ==== HASH JOIN 예시 | + | ==== HASH 조인 단점 ==== |
+ | * 해시테이블을 생성하는 비용이 수반 | ||
+ | * Build Input이 작을 때 효과적이다.(PGA에 할당되는 Hash Area에 담길정도로 충분히 작아야 함) | ||
+ | * 해시키 값으로 사용되는 컬럼에 중복값이 거의 없을 경우 효과적이다.(중복값이 많을수록 성능이 저하된다.) | ||
+ | ---- | ||
+ | |||
+ | === HASH JOIN 예시 === | ||
<source lang="sql"> | <source lang="sql"> | ||
SELECT /*+ USE_HASH(B) */ | SELECT /*+ USE_HASH(B) */ |
2023년 4월 4일 (화) 15:22 판
thumb_up 추천메뉴 바로가기
- DBA { Oracle DBA 명령어 > DBA 초급 과정 > DBA 고급 과정 }
- 튜닝 { 오라클 튜닝 목록 }
- 모델링 { 데이터 모델링 가이드 }
1 HASH 조인(HASH JOIN)[편집]
해시 함수를 이용하여 조직 테이블(데이터 작은쪽)에 해시테이블을 만들고 실적집계 테이블(데이터 많은쪽)을 탐색하면서 조인.
- Hash Join에서는 작은 테이블을 먼저 접근하는 것이 성능이 좋음(해시테이블을 빨리 build 하기때문).
이후 큰 테이블을 접근하여 해시 함수를 사용해서 순차적으로 해시 테이블로 탐색 한다.
- 대량 데이터를 처리하는 배치성 프로그램에 적합한 조인 방식.
2 HASH 조인의 특징[편집]
- Inner루프로 Hash Area에 생성해둔 해시테이블을 이용한다는 것 외에 NL조인과 유사하다.
- 해시테이블 만들 때는 전체범위처리가 불가피하나, Prob Input을 스캔하는 단계는 부분범위 처리가능하다.
- 해시조인은 해시테이블이 PGA영역에 할당되므로, NL조인보다 빠르다.
- NL조인은 Outer테이블에서 읽히는 레코드마다 Inner쪽 테이블 버퍼캐시 탐색을 위해 래치획득을 반복하나, 해시조인은 래치 획득과정없이 PGA에서 빠르게 데이터를 탐색할 수 있다.
2.1 HASH 조인 장점[편집]
- NL조인처럼 조인시 발생하는 Random엑세스 부하가 없다.
- 소트머지조인처럼 조인전에 양쪽 집합을 정렬해야 하는 부담이 없다.
2.2 HASH 조인 단점[편집]
- 해시테이블을 생성하는 비용이 수반
- Build Input이 작을 때 효과적이다.(PGA에 할당되는 Hash Area에 담길정도로 충분히 작아야 함)
- 해시키 값으로 사용되는 컬럼에 중복값이 거의 없을 경우 효과적이다.(중복값이 많을수록 성능이 저하된다.)
3 HASH JOIN 예시[편집]
SELECT /*+ USE_HASH(B) */
A.조직명,A.조직코드,SUM(B.실적),...
FROM 조직 A
, 실적집계 B
WHERE A.조직코드 = B.조직코드. -- hash 함수를 사용 하여 해시키 생성 후 조인
AND A.사업부 = 'ㅇ사업부서명'. -- index를 사용 하여 성능 개선
AND B.집계년월 = '201908' -- index를 사용 하여 성능 개선
GROUP BY A.조직명,A.조직코드
(설명)
1. 조직 테이블(A)에서 사업부가 ‘ㅇ사업부서명’조회 후, 조인 컬럼인 조직코드를 해시 함수로 분류한 다음, 해시테이블 을 생성. (Build Input , 해시 함수를 이용해 해시 테이블 구성)
2. 실적집계 테이블(B) 에서 집계년월이 ‘201908’를 조회 후, 조인 컬럼인 조직코드를 해시 함수로 변환 후 해시 테이블로 순차 적으로 접근한다. (Probe Input 해시 함수를 통하여 해시 테이블을 탐색)
- 조회 조건 컬럼인 A.사업부 컬럼과 B.집계년월 컬럼의 인덱스를 사용하여 성능을 개선하고 ,
- 조인 컬럼인 A.조직코드 = B.조직코드는 인덱스가 존재하더라도 사용되지 않는다.