Интернет магазин китайских планшетных компьютеров |
||||
Компьютеры - UTF-1602 июля 2011Оглавление: 1. UTF-16 2. История появления 3. UTF-16 в ОС Windows UTF-16 в информатике — один из способов кодирования символов из Unicode в виде последовательности 16-битных слов. Символы с кодами 0x0000..0xD7FF и 0xE000..0xFFFF представляются одним 16-битным словом, а символы с кодами 0x10000—0x10FFFF — в виде последовательности двух 16-битных слов. Количество символов, представляемых двумя 16-битными словами равно. Для представления символов с кодами 0x10000—0x10FFFF используется матрица перекодировки. Первое слово из двух переданных лежит в диапазоне 0xD800–0xDBFF, а второе — 0xDC00—0xDFFF. Именно этот диапазон значений не может встречаться среди символов, передаваемых с помощью одного 16-битного слова, так что расшифровка кодировки всегда однозначна. Ясно, что имеется как раз 2 * 2 = 2 таких комбинаций. ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Впрочем, в подавляющем большинстве случаев текст в UTF-16 является просто последовательностью символов из UCS-2, т.к. символы Unicode после кода 0x10000 используются крайне редко. Просмотров: 2705
|