Интернет магазин китайских планшетных компьютеров



Компьютеры - Октеты со старшим битом 1

19 июля 2011


Оглавление:
1. Октеты со старшим битом 1
2. Проблемы с хранением и передачей



Подмножество октетов со старшим битом 1 включает те значения октета, у которых старший бит равен единице. Содержит коды 10000000..11111111 в двоичном представлении, 0x80..0xFF в шестнадцатеричном, 0200..0377 в восьмеричном, 128..255 в десятичном беззнаковом. В дополнительном коде октеты со старшим битом 1 являются отрицательными числами от -128 до -1.

Использование для кодирования символов

Причина использования

Причина особого рассмотрения данного подмножества связана с компьютерным представлением текста, в контексте которого оно называется также второй, или верхней половиной кодовой таблицы. Общеупотребительная кодовая страница ASCII является 7-битной, то есть любой ASCII-символ в 8-битном представлении имеет старший бит 0. Таким образом, октеты со старшим битом 1 можно использовать для кодирования символов, не входящих в ASCII, то есть для расширения набора символов. Поэтому 8-битную кодовую таблицу называют также расширенной таблицей ASCII, а варианты её второй половины — расширениями ASCII.

Набор символов ASCII явно недостаточен для представления текста на большинстве языков. В результате появились 8-битные кодовые страницы, совместимые с ASCII, но несовместимые между собой. Ныне малоизвестная кодировка EBCDIC с самого начала была 8-битной, и деление символов по значению старшего бита там отсутствует.

Иной подход использует UTF-8, а также кодировки некоторых азиатских языков. Дополнительные символы кодируются последовательностями двух или более октетов со старшим битом 1.

Примеры использования второй половины кодовой таблицы

тип кодировки 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. A. B. C. D. E. F.
VGA символы печатные символы
ASCII
символы Псевдографика символы
ASCII упр. симв. не используются
Обычная 8-битная кодовая страница печатные символы
кодовая страница ISO 8859-x упр. симв. печатные символы
UTF-8 представление младшей части кода начало 2-байтной кодовой последова- тельности начало 3-байтной кодовой последова- тельности

ISO 8859

В 1992 году международная организация ISO ввела стандарт ISO 8859 в попытке упорядочить использование ASCII-совместимых кодовых страниц. Стандарт представляет список кодировок, время от времени расширяемый. 32 позиции второй половины кодовой таблицы были отведены под управляющие символы, а в остальных 96 позициях располагались используемые в различных языках символы, не входящие в ASCII. Предложенная кодовая страница кириллицы ISO 8859-5 не нашла применения, однако другие страницы ISO 8859 послужили основой для создания проприетарных расширений, заменяющих управляющие символы ISO 8859 печатными символами. Наиболее известным таким расширением является страница Windows-1252, сделанная на основе ISO 8859-1.

КОИ-8

Кодовые страницы кириллицы семейства КОИ-8 специально разработаны с учётом возможных проблем со старшим битом — при сбросе старшего бита русские буквы превращаются в ASCII-символы так, что читаемость текста сохраняется.



Просмотров: 1181


<<< Набор символов ZX Spectrum
Основная кодировка >>>