'UTF8' 태그의 글 목록

'UTF8'에 해당되는 글 1건

2010.04.23 iconv() 함수 완전정복(?)

프로그램 사용/iconv() & glibc2010. 4. 23. 15:11

iconv() 함수 완전정복(?)

iconv() 함수에서
변환결과로 나와야 하는 방법이 unicode일 경우에는 (일단 다른건 안해봤으니 -ㅁ-?)
(strlen(inbuf) + 2) * 2 가 된다.

size_t iconv(iconv_t cd,
char **inbuf, size_t *inbytesleft,
char **outbuf, size_t *outbytesleft);

예를 들어 UTF-8을 UNICODE로 변환시에는
UTF-8 문자열 특성상, stelen(utf8str) == 100 일 경우
유니코드(2바이트) 스트링은 최소 25에서 최대 100 까지 변환이 된다.

그리고 iconv 특성상 처음에 2바이트 BOM(Byte Order Mark)을 붙이므로
실질적으로 변환을 위해 필요로 하는 outbuf의 길이는
(strlen(inbuf) + 2) * 2 가 된다.

원래대로라면
(strlen(inbuf) + 1) * 2 + 2 이고
+1 은 '\0'
+2 는 Unicode BOM(0xFEFF in big endian)이다.

[링크 : http://mwultong.blogspot.com/2006/05/qna-unicode-bom-byte-order-mark.html]

덧 : UTF-8로 인코딩된 아랍어의 경우, 조합은 별도로 해주어야 한다.
iconv()가 UNICODE로 변환은 해주지만, 그렇다고 해서 조합까지 해주지는 않는다.

'프로그램 사용 > iconv() & glibc' 카테고리의 다른 글

iconv / gconv 사용시 주의사항(?) - 포팅시 유의사항 (0)	2010.06.01
iconv 라이브러리 위치 (0)	2010.06.01
iconv() 함수 사용하기 (6)	2010.04.20
linux iconv 테스트 (0)	2010.04.20
iconv 유틸리티/프로그램 사용하기 (2)	2010.04.19

Posted by 구차니

«이전 1 다음»

구차니의 잡동사니 모음

'UTF8'에 해당되는 글 1건

iconv() 함수 완전정복(?)

'프로그램 사용 > iconv() & glibc' 카테고리의 다른 글

카테고리

공지사항

태그목록

최근에 올라온 글

최근에 달린 댓글

티스토리툴바