HTML 문자 집합


HTML 페이지를 올바르게 표시하려면 브라우저에서 사용할 문자 집합(인코딩)을 알아야 합니다.

예시

<meta charset="UTF-8">

HTML 문자 집합

HTML5 사양은 웹 개발자가 UTF-8 문자 집합을 사용하도록 권장합니다!

항상 그런 것은 아닙니다. 초기 웹의 문자 인코딩은 ASCII였습니다.

나중에 HTML 2.0에서 HTML 4.01까지 ISO-8859-1이 표준 문자 집합으로 간주되었습니다.

XML과 HTML5를 통해 UTF-8이 마침내 도착하여 많은 문자 인코딩 문제를 해결했습니다.


처음에: ASCII

컴퓨터 데이터는 전자 장치에 이진 코드(01000101)로 저장됩니다.

텍스트 저장을 표준화하기 위해 ASCII(American Standard Code for Information Interchange)가 만들어졌습니다. 0-9의 숫자, 대문자 및 소문자 알파벳(az, AZ) 및 ! $ + - ( ) @ < > , .

ASCII는 문자에 7비트를 사용했기 때문에 128개의 다른 문자만 나타낼 수 있습니다.

ASCII의 가장 큰 약점은 영어 이외의 문자를 제외한다는 것입니다.

ASCII는 오늘날 특히 대형 메인프레임 컴퓨터 시스템에서 여전히 사용되고 있습니다.

자세히 알아보려면 완전한 ASCII 참조 문서를 참조 하십시오.


Windows: Windows-1252

Windows-1252는 Windows 95까지 Windows의 기본 문자 집합이었습니다.

국제 문자가 추가된 ASCII 확장입니다.

전체 바이트(8비트)를 사용하여 256개의 다른 문자를 나타냅니다.

Windows-1252는 Windows의 기본값이었기 때문에 모든 브라우저에서 지원됩니다.

자세히 살펴보려면 전체 Windows-1252 참조 문서를 참조 하십시오.



HTML 4: ISO-8859-1

HTML 4에서 가장 많이 사용된 문자 집합은 ISO-8859-1이었습니다.

ISO-8859-1은 국제 문자가 추가된 ASCII의 확장입니다.

예시

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

HTML 4에서는 ISO-8859-1과 다른 문자 집합을 <meta> 태그에 지정할 수 있습니다.

예시

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

모든 HTML 4 프로세서는 UTF-8도 지원합니다.

예시

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

브라우저가 ISO-8859-1을 감지하면 Windows-1252에는 32개의 국제 문자가 더 있기 때문에 일반적으로 Windows-1252로 기본 설정됩니다.

자세히 알아보려면 ISO-8859-1 전체 참조 문서를 참조하십시오.


HTML5: 유니코드 UTF-8

HTML5 사양은 웹 개발자가 UTF-8 문자 집합을 사용하도록 권장합니다.

예시

<meta charset="UTF-8">

<meta> 태그에 UTF-8과 다른 문자 집합을 지정할 수 있습니다.

예시

<meta charset="ISO-8859-1">

Unicode Consortium은 ISO-8859 문자 집합이 제한적이고 다국어 환경과 호환되지 않기 때문에 UTF-8 및 UTF-16 표준을 개발했습니다.

유니코드 표준은 세계의 (거의) 모든 문자, 구두점 및 기호를 다룹니다.

모든 HTML5 및 XML 프로세서는 UTF-8, UTF-16, Windows-1252 및 ISO-8859를 지원합니다.

자세히 알아보려면 전체 유니코드 참조 를 참조 하십시오.