Интернет магазин китайских планшетных компьютеров



Компьютеры - Перевод строки - В Юникоде

23 января 2011


Оглавление:
1. Перевод строки
2. В ASCII
3. В Юникоде
4. История



По стандарту, любое совместимое с Юникодом приложение должно воспринимать как перевод строки каждый из нижеследующих символов:

  • LF: англ. line feed — подача строки;
  • CR: англ. carriage return — возврат каретки;
  • NEL: англ. next line — переход на следующую строку;
  • LS: англ. line separator — разделитель строк;
  • PS: англ. paragraph separator — разделитель абзацев.

Последовательность CR+LF надлежит воспринимать как один перевод строки, а не два.

Трудности

Нет общепринятых сокращений русских терминов. ВК совпадает по написанию с сокращением от англ. BreaK, а ПС не различает Подачу Строки и Перевод Строки.

Разница представлений

Отсутствие единого общепринятого представления перевода строки в разных операционных системах осложняет обмен текстовыми данными между ними. Юникод старается примирить эту разницу, уравнивая CR, LF и CR+LF, однако вступает в противоречие с наследуемым им ASCII при трактовке последовательности LF+CR, не предварённой CR: согласно ASCII это один перевод строки, а согласно Юникоду — два. Вероятно, Юникод сделал ставку на не существовавшие в ASCII разделители строк и абзацев, но они не прижились.

Перевод строки при вводе с клавиатуры представлен единообразно во всех системах — символом CR, и в системах с другим представлением перевода строки текстовые данные приходится перекодировать.

Последняя строка

Даже в современных изданиях ОС UNIX и её наследника Linux отсутствие перевода строки в конце системных конфигурационных файлов приводит к тому, что последняя строка не учитывается, а вроде правильно составленный файл не работает, представляясь головоломкой для пользователя, не предупреждённого об этой самобытной особенности. См. раздел Конец строки.



Просмотров: 6848


<<< Atlantis Word Processor
Перенос (типографика) >>>