Интернет магазин китайских планшетных компьютеров



Компьютеры - Юникод - Система кодирования

23 января 2011


Оглавление:
1. Юникод
2. Предпосылки создания и развитие Юникода
3. Версии Юникода
4. Система кодирования
5. Формы нормализации
6. Двунаправленное письмо
7. Представленные символы
8. ISO/IEC 10646
9. Способы представления
10. Методы ввода
11. Проблемы Юникода
12. «Юникод» или «Уникод»?



Универсальная система кодирования представляет собой набор графических символов и способ их кодирования для компьютерной обработки текстовых данных.

Графические символы — это символы, имеющие видимое изображение. Графическим символам противопоставляются управляющие символы и символы форматирования.

Графические символы включают в себя следующие группы:

  • буквы, содержащиеся хотя бы в одном из обслуживаемых алфавитов;
  • цифры;
  • знаки пунктуации;
  • специальные знаки;
  • разделители.

Юникод — это система для линейного представления текста. Символы, имеющие дополнительные над- или подстрочные элементы, могут быть представлены в виде построенной по определённым правилам последовательности кодов или в виде единого символа.

Модифицирующие символы

Представление символа «Й» в виде базового символа «И» и модифицирующего символа « ̆»

Графические символы в Юникоде подразделяются на протяжённые и непротяжённые. Непротяжённые символы при отображении не занимают места в строке. К ним относятся, в частности, знаки ударения и прочие диакритические знаки. Как протяжённые, так и непротяжённые символы имеют собственные коды. Протяжённые символы иначе называются базовыми, а непротяжённые — модифицирующими; причём последние не могут встречаться самостоятельно. Например, символ «á» может быть представлен как последовательность базового символа «a» и модифицирующего символа « » или как монолитный символ «á».

Особый тип модифицирующих символов — селекторы варианта начертания. Они действуют только на те символы, для которых такие варианты определены. В версии 5.0 варианты начертания определены для ряда математических символов, для символов традиционного монгольского алфавита и для символов монгольского квадратного письма.



Просмотров: 14043


<<< Тюремная азбука
HKSCS >>>