Интернет магазин китайских планшетных компьютеров |
|||||||
Компьютеры - Октеты со старшим битом 119 июля 2011Оглавление: 1. Октеты со старшим битом 1 2. Проблемы с хранением и передачей Подмножество октетов со старшим битом 1 включает те значения октета, у которых старший бит равен единице. Содержит коды 10000000..11111111 в двоичном представлении, 0x80..0xFF в шестнадцатеричном, 0200..0377 в восьмеричном, 128..255 в десятичном беззнаковом. В дополнительном коде октеты со старшим битом 1 являются отрицательными числами от -128 до -1. Использование для кодирования символовПричина использованияПричина особого рассмотрения данного подмножества связана с компьютерным представлением текста, в контексте которого оно называется также второй, или верхней половиной кодовой таблицы. Общеупотребительная кодовая страница ASCII является 7-битной, то есть любой ASCII-символ в 8-битном представлении имеет старший бит 0. Таким образом, октеты со старшим битом 1 можно использовать для кодирования символов, не входящих в ASCII, то есть для расширения набора символов. Поэтому 8-битную кодовую таблицу называют также расширенной таблицей ASCII, а варианты её второй половины расширениями ASCII. Набор символов ASCII явно недостаточен для представления текста на большинстве языков. В результате появились 8-битные кодовые страницы, совместимые с ASCII, но несовместимые между собой. Ныне малоизвестная кодировка EBCDIC с самого начала была 8-битной, и деление символов по значению старшего бита там отсутствует. Иной подход использует UTF-8, а также кодировки некоторых азиатских языков. Дополнительные символы кодируются последовательностями двух или более октетов со старшим битом 1. Примеры использования второй половины кодовой таблицы
ISO 8859В 1992 году международная организация ISO ввела стандарт ISO 8859 в попытке упорядочить использование ASCII-совместимых кодовых страниц. Стандарт представляет список кодировок, время от времени расширяемый. 32 позиции второй половины кодовой таблицы были отведены под управляющие символы, а в остальных 96 позициях располагались используемые в различных языках символы, не входящие в ASCII. Предложенная кодовая страница кириллицы ISO 8859-5 не нашла применения, однако другие страницы ISO 8859 послужили основой для создания проприетарных расширений, заменяющих управляющие символы ISO 8859 печатными символами. Наиболее известным таким расширением является страница Windows-1252, сделанная на основе ISO 8859-1. КОИ-8Кодовые страницы кириллицы семейства КОИ-8 специально разработаны с учётом возможных проблем со старшим битом — при сбросе старшего бита русские буквы превращаются в ASCII-символы так, что читаемость текста сохраняется. Просмотров: 2034
|