Интернет магазин китайских планшетных компьютеров



Компьютеры - Набор символов

23 января 2011


Оглавление:
1. Набор символов
2. Автоматическое распознавание кодировок
3. Распространенные кодировки



Набор символов — таблица, задающая кодировку конечного множества символов алфавита. Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита в компьютере).

Набор символов в компьютере

Символы в компьютере обычно кодируются одним или нескольким байтами.

Хотя термин «набор символов», узаконенный интернет-стандартом RFC 2278, сейчас является, пожалуй, наиболее авторитетным, предшествовавший ему термин «кодировка» по-прежнему используется в качестве синонима, в частности, в языках программирования Java, Perl и XSLT, а также в HTML.

Нередко также вместо термина «набор символов» неправильно употребляют термин «кодовая страница», означающий на самом деле частный случай набора символов с однобайтным кодированием.

В настоящее время в основном используются кодировки трёх типов: совместимые с ASCII, совместимые с EBCDIC и основанные на Юникоде 16-битные, с подавляющим преобладанием первых. Представление UTF-8 Юникода совместимо с ASCII. Кодировки на базе EBCDIC используются только на некоторых мэйнфреймах. Первоначально в каждой операционной системе использовался один набор символов. Теперь используемые наборы символов стандартизованы, зависят от типа операционной системы лишь по традиции и устанавливаются согласно локали.

В Википедии и других проектах Фонда Викимедиа используется Юникод UTF-8.



Просмотров: 3135


<<< Кодовая страница
ASCII >>>