본문 바로가기

쓰레기장""

왜 윈도우의 파일이 맥에서 오면 한글이 깨지는가?

1. 유니코드 

전세계 모든 글자를 표현할수 있는 글자표. 

초기에 1바이트에 ASCII를 비롯한 알파벳만 들어있었어 각 나라에서 남은 공간에 자국의 문자를 할당하여 사용했다. 


2. UTF-8

조합형 문자 집합 ( ㄱ, ㄴ, ㄷ, ㄹ...., ㅏ, ㅓ, ㅡ, ㅣ....)

이미 유니코드에 모든 문자가 들어가 있어 그냥 사용하면 되는데 왜 UTF-8을 사용하느냐?! 

바로 문자가 표현하기 위한 용량을 줄이는것. (유니코드 대신 UTF-8을 사용하는게 아닌 유니코드를 읽고 쓰는 방식을 달리하는 방식) 

UTF-8은 1~4byte의 가변적 인코딩으로 영문은 1byte / 한중일 3byte을 사용한다. 

- 유닉스 / 리눅스 계열에서 사용


3. EUC-KR

완성형 한글 (가, 나, 다, 라 ...)

아스키코드와는 별도의 문자셋 코드표를 만듬. 2byte를 사용


4. CP949(MS949)

완성형 코드표, MS949는  MS사에서 CP949를 확장해서 만들었으며, 윈도우에 쓰이는 문자표, 

윈도우에 쓰이는 한글은 EUC-KR를 확장하여 MS949에 집어넣음(같은 완성형 코드이기 때문에)



왜 윈도우의 파일이 맥에서 오면 한글이 깨지는가?

윈도우의 문자표 (MS949) <--> 맥의 문자표 (UTF-8)

바로 운영체제에서 사용하는 문자표가 다르기 때문......



참고


'쓰레기장""' 카테고리의 다른 글

jenkins 설치 및 연동  (0) 2019.05.14
우주라이크  (0) 2018.12.28
jetbrains day  (0) 2018.11.23
dev day seoul  (0) 2018.11.07
sublime text sass Syntax Highlighting 설치  (0) 2016.06.11