Интернет магазин китайских планшетных компьютеров



Компьютеры - Переносимый набор символов

23 января 2011





Переносимый набор символов — набор из 103 символов, которые, согласно стандарту POSIX, должны присутствовать в любой используемой кодировке. Включает в себя все печатные символы US-ASCII и часть управляющих. Является базовым алфавитом для практически всех современных языков программирования.

На коды символов из переносимого набора накладываются следующие ограничения:

  • NUL должен быть символом, где все биты установлены в 0.
  • Коды десятичных цифр 0—9 должны идти в возрастающем порядке, причём коды двух соседних цифр должны отличаться на единицу.
  • Коды всех символов из этого набора должны быть представимы одним байтом.
  • Если для представления символов в языке C используется тип char, то коды символов из этого набора обязательно должны быть неотрицательными.
название  глиф   строка 
Си
 Юникод  название в Юникоде
NUL   \0 U+0000 NULL
alert   \a U+0007 BELL
backspace   \b U+0008 BACKSPACE
tab   \t U+0009 CHARACTER TABULATION
carriage-return   \r U+000D CARRIAGE RETURN
newline   \n U+000A LINE FEED
vertical-tab   \v U+000B LINE TABULATION
form-feed   \f U+000C FORM FEED
space     U+0020 SPACE
exclamation-mark  !  ! U+0021 EXCLAMATION MARK
quotation-mark " \" U+0022 QUOTATION MARK
number-sign # # U+0023 NUMBER SIGN
dollar-sign $ $ U+0024 DOLLAR SIGN
percent-sign  %  % U+0025 PERCENT SIGN
ampersand & & U+0026 AMPERSAND
apostrophe ' \' U+0027 APOSTROPHE
left-parenthesis ( ( U+0028 LEFT PARENTHESIS
right-parenthesis ) ) U+0029 RIGHT PARENTHESIS
asterisk * * U+002A ASTERISK
plus-sign + + U+002B PLUS SIGN
comma , , U+002C COMMA
hyphen - - U+002D HYPHEN-MINUS
period . . U+002E FULL STOP
slash / / U+002F SOLIDUS
zero 0 0 U+0030 DIGIT ZERO
one 1 1 U+0031 DIGIT ONE
two 2 2 U+0032 DIGIT TWO
three 3 3 U+0033 DIGIT THREE
four 4 4 U+0034 DIGIT FOUR
five 5 5 U+0035 DIGIT FIVE
six 6 6 U+0036 DIGIT SIX
seven 7 7 U+0037 DIGIT SEVEN
eight 8 8 U+0038 DIGIT EIGHT
nine 9 9 U+0039 DIGIT NINE
colon  :  : U+003A COLON
semicolon  ;  ; U+003B SEMICOLON
less-than-sign < < U+003C LESS-THAN SIGN
equals-sign = = U+003D EQUALS SIGN
greater-than-sign > > U+003E GREATER-THAN SIGN
question-mark  ?  ? U+003F QUESTION MARK
commercial-at @ @ U+0040 COMMERCIAL AT
A A A U+0041 LATIN CAPITAL LETTER A
B B B U+0042 LATIN CAPITAL LETTER B
C C C U+0043 LATIN CAPITAL LETTER C
D D D U+0044 LATIN CAPITAL LETTER D
E E E U+0045 LATIN CAPITAL LETTER E
F F F U+0046 LATIN CAPITAL LETTER F
G G G U+0047 LATIN CAPITAL LETTER G
H H H U+0048 LATIN CAPITAL LETTER H
I I I U+0049 LATIN CAPITAL LETTER I
J J J U+004A LATIN CAPITAL LETTER J
K K K U+004B LATIN CAPITAL LETTER K
L L L U+004C LATIN CAPITAL LETTER L
M M M U+004D LATIN CAPITAL LETTER M
N N N U+004E LATIN CAPITAL LETTER N
O O O U+004F LATIN CAPITAL LETTER O
P P P U+0050 LATIN CAPITAL LETTER P
Q Q Q U+0051 LATIN CAPITAL LETTER Q
R R R U+0052 LATIN CAPITAL LETTER R
S S S U+0053 LATIN CAPITAL LETTER S
T T T U+0054 LATIN CAPITAL LETTER T
U U U U+0055 LATIN CAPITAL LETTER U
V V V U+0056 LATIN CAPITAL LETTER V
W W W U+0057 LATIN CAPITAL LETTER W
X X X U+0058 LATIN CAPITAL LETTER X
Y Y Y U+0059 LATIN CAPITAL LETTER Y
Z Z Z U+005A LATIN CAPITAL LETTER Z
left-square-bracket [ [ U+005B LEFT SQUARE BRACKET
backslash \ \\ U+005C REVERSE SOLIDUS
right-square-bracket ] ] U+005D RIGHT SQUARE BRACKET
circumflex ^ ^ U+005E CIRCUMFLEX ACCENT
underscore _ _ U+005F LOW LINE
grave-accent ` ` U+0060 GRAVE ACCENT
a a a U+0061 LATIN SMALL LETTER A
b b b U+0062 LATIN SMALL LETTER B
c c c U+0063 LATIN SMALL LETTER C
d d d U+0064 LATIN SMALL LETTER D
e e e U+0065 LATIN SMALL LETTER E
f f f U+0066 LATIN SMALL LETTER F
g g g U+0067 LATIN SMALL LETTER G
h h h U+0068 LATIN SMALL LETTER H
i i i U+0069 LATIN SMALL LETTER I
j j j U+006A LATIN SMALL LETTER J
k k k U+006B LATIN SMALL LETTER K
l l l U+006C LATIN SMALL LETTER L
m m m U+006D LATIN SMALL LETTER M
n n n U+006E LATIN SMALL LETTER N
o o o U+006F LATIN SMALL LETTER O
p p p U+0070 LATIN SMALL LETTER P
q q q U+0071 LATIN SMALL LETTER Q
r r r U+0072 LATIN SMALL LETTER R
s s s U+0073 LATIN SMALL LETTER S
t t t U+0074 LATIN SMALL LETTER T
u u u U+0075 LATIN SMALL LETTER U
v v v U+0076 LATIN SMALL LETTER V
w w w U+0077 LATIN SMALL LETTER W
x x x U+0078 LATIN SMALL LETTER X
y y y U+0079 LATIN SMALL LETTER Y
z z z U+007A LATIN SMALL LETTER Z
left-brace { { U+007B LEFT CURLY BRACKET
vertical-line | | U+007C VERTICAL LINE
right-brace } } U+007D RIGHT CURLY BRACKET
tilde ~ ~ U+007E TILDE
Кодировки символов
Основы → алфавит • текст • набор символов • конверсия
Исторические кодировки → Докомп.: семафорная • Морзе • Бодо • МТК-2 Комп.: 6 бит • УПП • RADIX-50 • EBCDIC • КОИ-7 • ISO 646
совре-
менное
8-битное
представ-
ление
символы → ASCII не-ASCII
8бит. код.стр. Разные →   Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic
ISO 8859 → 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Windows → 1250 1251 1252 1253 1254 1255 1256 1257 1258 | WGL4
IBM&DOS → 437 • 850 • 852 • 855 • 866 «альт.» • •
Много-
байтные
Традиционные → DBCS • HTML
Unicode → UTF-16 • UTF-8 • список символов
Связанные
темы →
интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение Утилиты: iconv • recode


Просмотров: 1204


<<< Основная кодировка
Печатные символы >>>