본문 바로가기

쓰레기장""

왜 윈도우의 파일이 맥에서 오면 한글이 깨지는가?

No.190 2018. 12. 9. 00:07

1. 유니코드

전세계 모든 글자를 표현할수 있는 글자표.

초기에 1바이트에 ASCII를 비롯한 알파벳만 들어있었어 각 나라에서 남은 공간에 자국의 문자를 할당하여 사용했다.

2. UTF-8

조합형 문자 집합 ( ㄱ, ㄴ, ㄷ, ㄹ...., ㅏ, ㅓ, ㅡ, ㅣ....)

이미 유니코드에 모든 문자가 들어가 있어 그냥 사용하면 되는데 왜 UTF-8을 사용하느냐?!

바로 문자가 표현하기 위한 용량을 줄이는것. (유니코드 대신 UTF-8을 사용하는게 아닌 유니코드를 읽고 쓰는 방식을 달리하는 방식)

UTF-8은 1~4byte의 가변적 인코딩으로 영문은 1byte / 한중일 3byte을 사용한다.

- 유닉스 / 리눅스 계열에서 사용

3. EUC-KR

완성형 한글 (가, 나, 다, 라 ...)

아스키코드와는 별도의 문자셋 코드표를 만듬. 2byte를 사용

4. CP949(MS949)

완성형 코드표, MS949는 MS사에서 CP949를 확장해서 만들었으며, 윈도우에 쓰이는 문자표,

윈도우에 쓰이는 한글은 EUC-KR를 확장하여 MS949에 집어넣음(같은 완성형 코드이기 때문에)

왜 윈도우의 파일이 맥에서 오면 한글이 깨지는가?

윈도우의 문자표 (MS949) <--> 맥의 문자표 (UTF-8)

바로 운영체제에서 사용하는 문자표가 다르기 때문......

참고

위키피디아: http://ko.wikipedia.org/wiki/유니코드
한글인코딩의 이해1: http://helloworld.naver.com/helloworld/textyle/19187
유니코드 문자 변환기: http://www.nl.go.kr/kolisnet/convert/convert.php

저작자표시 (새창열림)

'쓰레기장""' 카테고리의 다른 글

jenkins 설치 및 연동 (0)	2019.05.14
우주라이크 (0)	2018.12.28
jetbrains day (0)	2018.11.23
dev day seoul (0)	2018.11.07
sublime text sass Syntax Highlighting 설치 (0)	2016.06.11

티스토리툴바