"문자셋 character set"의 두 판 사이의 차이
DB CAFE
(새 문서: == 문자셋 , 캐릭터셋 (character set) == === ANSI === === UTF8 === # UTF8은 3byte 기준으로 문자열 저장 # 데이터 범위는 U+9999까지 # 그외 보충 문자열(Su...) |
(→UTF8 vs AL32UTF8 비교표) |
||
22번째 줄: | 22번째 줄: | ||
|Oracle Version || 8.0 ~ 9l || >= 9i | |Oracle Version || 8.0 ~ 9l || >= 9i | ||
|- | |- | ||
− | |||
| Unicode Encoding || UTF8 || UTF8 | | Unicode Encoding || UTF8 || UTF8 | ||
|- | |- |
2024년 3월 25일 (월) 13:36 판
thumb_up 추천메뉴 바로가기
- DBA { Oracle DBA 명령어 > DBA 초급 과정 > DBA 고급 과정 }
- 튜닝 { 오라클 튜닝 목록 }
- 모델링 { 데이터 모델링 가이드 }
1 문자셋 , 캐릭터셋 (character set)[편집]
1.1 ANSI[편집]
1.2 UTF8[편집]
- UTF8은 3byte 기준으로 문자열 저장
- 데이터 범위는 U+9999까지
- 그외 보충 문자열(Supplementary characters, 보조 문자) 는 U+ 10000에서 U+ 10FFFF까지 코드 포인트가 할당 된 문자까지 저장할 수 있는 타입
1.3 UTF8과 AL32UTF8 차이점[편집]
- AL32UTF8 은 U+ FFFF( 3byte 표현) 보다 큰 유니 코드 문자
- Compatibility Encoding Scheme for UTF-16: 8-Bit (CESU-8) 라고 표현
- AL32UTF8에 저장할 수 있는 4byte 문자에는 대표적으로 한자와 이모지가 있다.
- U + 2070E : 𠜎
- U+1F601 : 😁
1.3.1 UTF8 vs AL32UTF8 비교표[편집]
구분 | UTF8 | AL32UTF8 |
---|---|---|
UNICODE Version | 2.1 ~ 3.0 | 3.0~3.1 |
Oracle Version | 8.0 ~ 9l | >= 9i |
Unicode Encoding | UTF8 | UTF8 |
보충, 보조문자열(Supplementary characters)지원 | X | O |
oracle 8i 이하 client 지원 | O | X |
가변넓이 | 1~3byte | 1~4byte |
- 특이사항.
- UTF8 -> AL32UTF8 Datadump로 이관 시 에러 발생, DataPump Export/Import 사용 필요.AL32UTF8를 이용할 때 이런 보충, 보조문자열을 지원하는지 테스트 하는 것이 중요
- 실제 DB를 이용하는 어플리케이션( 프로그램/시스템 ) 에 문제가 없는지 확인이 필요
- 참고로 mysql, mariadb에서 이런 문자셋을 utf8, utf8mb4라고 표현 함