Интернет магазин китайских планшетных компьютеров



Компьютеры - UTF-16

02 июля 2011


Оглавление:
1. UTF-16
2. История появления
3. UTF-16 в ОС Windows



UTF-16 в информатике — один из способов кодирования символов из Unicode в виде последовательности 16-битных слов. Символы с кодами 0x0000..0xD7FF и 0xE000..0xFFFF представляются одним 16-битным словом, а символы с кодами 0x10000—0x10FFFF — в виде последовательности двух 16-битных слов. Количество символов, представляемых двумя 16-битными словами равно. Для представления символов с кодами 0x10000—0x10FFFF используется матрица перекодировки. Первое слово из двух переданных лежит в диапазоне 0xD800–0xDBFF, а второе — 0xDC00—0xDFFF. Именно этот диапазон значений не может встречаться среди символов, передаваемых с помощью одного 16-битного слова, так что расшифровка кодировки всегда однозначна. Ясно, что имеется как раз 2 * 2 = 2 таких комбинаций.

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

  DC00 DFFE DFFF
D800 010000 0103FE 0103FF
D801 010400 0107FE 0107FF
DBFF 10FC00 10FFFE  

Впрочем, в подавляющем большинстве случаев текст в UTF-16 является просто последовательностью символов из UCS-2, т.к. символы Unicode после кода 0x10000 используются крайне редко.



Просмотров: 2705


<<< Windows Glyph List 4