GB2312 에서 ASCII 로 0~127 까지는 영역은 1byte 그대로 사용한다

즉, gb2312로 인코딩 되었을 경우에는

 

 0~127  ASCII (1byte)
 A0 <=  간체 (2byte)

 

로 해석을 하면 되며, GB2312 폰트 테이블 상의 ASCII 0~127 영역은 


 R.C.   GB   Uni. UTF-8 

0301 ! A3A1 FF01 EFBC81 부터 시작을 한다.

 

하지만 우리가 사용하는 영역은 0x0021 부터 시작하므로 0~127 문자열은 gb2312로 변환후 유니코드 값에

단순산술로  0xFFE0 를 더해 주어야 한다.

 

잡솔 : 아래 Row 03에 대해서 문자를 선택해보면 !의 경우에 크기가 다름을 알 수 있다.

! <- ASCII

<- GB2312


Row 03: Latin Characters


'모종의 음모 > GB2312(중국어 간체)' 카테고리의 다른 글

GB2312 ASCII 부분 처리  (0) 2009.03.16
GB2312, Unicode  (0) 2009.03.16
GB2312 to Unicode mapping table  (0) 2009.03.16
Posted by 구차니

댓글을 달아 주세요