1 min read

MBCS에서는 한글을 어떻게 인식할까?

우리가 알고있는 아스키 코드는 위와 같지만 비주얼 스튜디오에서 아래와 같은 코드를 치게되면 한글이 나오는걸 확인할수있다.

#include <stdio.h>

int main(int argc, char** argv)
{

	printf("%s", "하느님은 도우하사.");
	
}

어떻게 윈도우는 이를 인식할까?

답은 0x80이 넘는 값들은 자국에서 사용하는 언어를 덧붙이게 된다.

이를 코드페이지라고 하며 한국인 경우 EUC-KR이고 다음과 같은 언어 세트가 있다. EUC-KR, EUN-CN, EUC-JP

이를 멀티바이트라고 말하고 이를 하나로 바꾼것이 유니코드이다.