1. 유니코드
전세계 모든 글자를 표현할수 있는 글자표.
초기에 1바이트에 ASCII를 비롯한 알파벳만 들어있었어 각 나라에서 남은 공간에 자국의 문자를 할당하여 사용했다.
2. UTF-8
조합형 문자 집합 ( ㄱ, ㄴ, ㄷ, ㄹ...., ㅏ, ㅓ, ㅡ, ㅣ....)
이미 유니코드에 모든 문자가 들어가 있어 그냥 사용하면 되는데 왜 UTF-8을 사용하느냐?!
바로 문자가 표현하기 위한 용량을 줄이는것. (유니코드 대신 UTF-8을 사용하는게 아닌 유니코드를 읽고 쓰는 방식을 달리하는 방식)
UTF-8은 1~4byte의 가변적 인코딩으로 영문은 1byte / 한중일 3byte을 사용한다.
- 유닉스 / 리눅스 계열에서 사용
3. EUC-KR
완성형 한글 (가, 나, 다, 라 ...)
아스키코드와는 별도의 문자셋 코드표를 만듬. 2byte를 사용
4. CP949(MS949)
완성형 코드표, MS949는 MS사에서 CP949를 확장해서 만들었으며, 윈도우에 쓰이는 문자표,
윈도우에 쓰이는 한글은 EUC-KR를 확장하여 MS949에 집어넣음(같은 완성형 코드이기 때문에)
왜 윈도우의 파일이 맥에서 오면 한글이 깨지는가?
윈도우의 문자표 (MS949) <--> 맥의 문자표 (UTF-8)
바로 운영체제에서 사용하는 문자표가 다르기 때문......
참고
- 위키피디아: http://ko.wikipedia.org/wiki/유니코드
- 한글인코딩의 이해1: http://helloworld.naver.com/helloworld/textyle/19187
- 유니코드 문자 변환기: http://www.nl.go.kr/kolisnet/convert/convert.php
'쓰레기장""' 카테고리의 다른 글
jenkins 설치 및 연동 (0) | 2019.05.14 |
---|---|
우주라이크 (0) | 2018.12.28 |
jetbrains day (0) | 2018.11.23 |
dev day seoul (0) | 2018.11.07 |
sublime text sass Syntax Highlighting 설치 (0) | 2016.06.11 |