Интернет магазин китайских планшетных компьютеров |
|
Компьютеры - Юникод - Предпосылки создания и развитие Юникода23 января 2011Оглавление: 1. Юникод 2. Предпосылки создания и развитие Юникода 3. Версии Юникода 4. Система кодирования 5. Формы нормализации 6. Двунаправленное письмо 7. Представленные символы 8. ISO/IEC 10646 9. Способы представления 10. Методы ввода 11. Проблемы Юникода 12. «Юникод» или «Уникод»? К концу 1980-х годов стандартом стали 8-битные символы, при этом существовало множество разных 8-битных кодировок, и постоянно появлялись всё новые. Это объяснялось как постоянным расширением круга поддерживаемых языков, так и стремлением создать кодировку, частично совместимую с какой-нибудь другой. В результате появилась необходимость решения нескольких задач:
Было признано необходимым создание единой «широкой» кодировки. Кодировки с переменной длиной символа, широко использующиеся в Восточной Азии, были признаны слишком сложными в использовании, поэтому было решено использовать символы фиксированной ширины. Использование 32-битных символов казалось слишком расточительным, поэтому было решено использовать 16-битные. Таким образом, первая версия Юникода представляла собой кодировку с фиксированным размером символа в 16 бит, то есть общее число кодов было 2. Отсюда происходит практика обозначения символов четырьмя шестнадцатеричными цифрами. При этом в Юникоде планировалось кодировать не все существующие символы, а только те, которые необходимы в повседневном обиходе. Редко используемые символы должны были размещаться в «области пользовательских символов», которая первоначально занимала коды В дальнейшем, однако, было принято решение кодировать все символы и в связи с этим значительно расширить кодовую область. Одновременно с этим, коды символов стали рассматриваться не как 16-битные значения, а как абстрактные числа, которые в компьютере могут представляться множеством разных способов. Поскольку в ряде компьютерных систем фиксированные 16-битные символы уже использовались в качестве кодировки по умолчанию, было решено все наиболее важные знаки кодировать только в пределах первых 65 536 позиций. Остальное пространство используется для «дополнительных символов»: систем письма вымерших языков или очень редко используемых китайских иероглифов, математических и музыкальных символов. Для совместимости со старыми 16-битными системами была изобретена система UTF-16, где первые 65 536 позиций, за исключением позиций из интервала U+D800…U+DFFF, отображаются непосредственно как 16-битные числа, а остальные представляются в виде «суррогатных пар». Для суррогатных пар была использована часть кодового пространства, ранее отведённого для «символов для частного использования». Поскольку в UTF-16 можно отобразить только 2+2−2048 символов, то это число и было выбрано в качестве окончательной величины кодового пространства Юникода. Хотя кодовая область Юникода была расширена за пределы 2 уже в версии 2.0, первые символы в «верхней» области были размещены только в версии 3.1. Роль этой кодировки в веб-секторе постоянно растёт, на начало 2010 доля веб-сайтов, использующих Юникод, составила около 50 %. Просмотров: 14503
|