|
|
|
Компьютеры - Переносимый набор символов23 января 2011
Переносимый набор символов — набор из 103 символов, которые, согласно стандарту POSIX, должны присутствовать в любой используемой кодировке. Включает в себя все печатные символы US-ASCII и часть управляющих. Является базовым алфавитом для практически всех современных языков программирования.
На коды символов из переносимого набора накладываются следующие ограничения:
- NUL должен быть символом, где все биты установлены в 0.
- Коды десятичных цифр 0—9 должны идти в возрастающем порядке, причём коды двух соседних цифр должны отличаться на единицу.
- Коды всех символов из этого набора должны быть представимы одним байтом.
- Если для представления символов в языке C используется тип char, то коды символов из этого набора обязательно должны быть неотрицательными.
| название |
глиф |
строка
Си |
Юникод |
название в Юникоде |
| NUL |
|
\0 |
U+0000 |
NULL |
| alert |
|
\a |
U+0007 |
BELL |
| backspace |
|
\b |
U+0008 |
BACKSPACE |
| tab |
|
\t |
U+0009 |
CHARACTER TABULATION |
| carriage-return |
|
\r |
U+000D |
CARRIAGE RETURN |
| newline |
|
\n |
U+000A |
LINE FEED |
| vertical-tab |
|
\v |
U+000B |
LINE TABULATION |
| form-feed |
|
\f |
U+000C |
FORM FEED |
| space |
|
|
U+0020 |
SPACE |
| exclamation-mark |
! |
! |
U+0021 |
EXCLAMATION MARK |
| quotation-mark |
" |
\" |
U+0022 |
QUOTATION MARK |
| number-sign |
# |
# |
U+0023 |
NUMBER SIGN |
| dollar-sign |
$ |
$ |
U+0024 |
DOLLAR SIGN |
| percent-sign |
% |
% |
U+0025 |
PERCENT SIGN |
| ampersand |
& |
& |
U+0026 |
AMPERSAND |
| apostrophe |
' |
\' |
U+0027 |
APOSTROPHE |
| left-parenthesis |
( |
( |
U+0028 |
LEFT PARENTHESIS |
| right-parenthesis |
) |
) |
U+0029 |
RIGHT PARENTHESIS |
| asterisk |
* |
* |
U+002A |
ASTERISK |
| plus-sign |
+ |
+ |
U+002B |
PLUS SIGN |
| comma |
, |
, |
U+002C |
COMMA |
| hyphen |
- |
- |
U+002D |
HYPHEN-MINUS |
| period |
. |
. |
U+002E |
FULL STOP |
| slash |
/ |
/ |
U+002F |
SOLIDUS |
| zero |
0 |
0 |
U+0030 |
DIGIT ZERO |
| one |
1 |
1 |
U+0031 |
DIGIT ONE |
| two |
2 |
2 |
U+0032 |
DIGIT TWO |
| three |
3 |
3 |
U+0033 |
DIGIT THREE |
| four |
4 |
4 |
U+0034 |
DIGIT FOUR |
| five |
5 |
5 |
U+0035 |
DIGIT FIVE |
| six |
6 |
6 |
U+0036 |
DIGIT SIX |
| seven |
7 |
7 |
U+0037 |
DIGIT SEVEN |
| eight |
8 |
8 |
U+0038 |
DIGIT EIGHT |
| nine |
9 |
9 |
U+0039 |
DIGIT NINE |
| colon |
: |
: |
U+003A |
COLON |
| semicolon |
; |
; |
U+003B |
SEMICOLON |
| less-than-sign |
< |
< |
U+003C |
LESS-THAN SIGN |
| equals-sign |
= |
= |
U+003D |
EQUALS SIGN |
| greater-than-sign |
> |
> |
U+003E |
GREATER-THAN SIGN |
| question-mark |
? |
? |
U+003F |
QUESTION MARK |
| commercial-at |
@ |
@ |
U+0040 |
COMMERCIAL AT |
| A |
A |
A |
U+0041 |
LATIN CAPITAL LETTER A |
| B |
B |
B |
U+0042 |
LATIN CAPITAL LETTER B |
| C |
C |
C |
U+0043 |
LATIN CAPITAL LETTER C |
| D |
D |
D |
U+0044 |
LATIN CAPITAL LETTER D |
| E |
E |
E |
U+0045 |
LATIN CAPITAL LETTER E |
| F |
F |
F |
U+0046 |
LATIN CAPITAL LETTER F |
| G |
G |
G |
U+0047 |
LATIN CAPITAL LETTER G |
| H |
H |
H |
U+0048 |
LATIN CAPITAL LETTER H |
| I |
I |
I |
U+0049 |
LATIN CAPITAL LETTER I |
| J |
J |
J |
U+004A |
LATIN CAPITAL LETTER J |
| K |
K |
K |
U+004B |
LATIN CAPITAL LETTER K |
| L |
L |
L |
U+004C |
LATIN CAPITAL LETTER L |
| M |
M |
M |
U+004D |
LATIN CAPITAL LETTER M |
| N |
N |
N |
U+004E |
LATIN CAPITAL LETTER N |
| O |
O |
O |
U+004F |
LATIN CAPITAL LETTER O |
| P |
P |
P |
U+0050 |
LATIN CAPITAL LETTER P |
| Q |
Q |
Q |
U+0051 |
LATIN CAPITAL LETTER Q |
| R |
R |
R |
U+0052 |
LATIN CAPITAL LETTER R |
| S |
S |
S |
U+0053 |
LATIN CAPITAL LETTER S |
| T |
T |
T |
U+0054 |
LATIN CAPITAL LETTER T |
| U |
U |
U |
U+0055 |
LATIN CAPITAL LETTER U |
| V |
V |
V |
U+0056 |
LATIN CAPITAL LETTER V |
| W |
W |
W |
U+0057 |
LATIN CAPITAL LETTER W |
| X |
X |
X |
U+0058 |
LATIN CAPITAL LETTER X |
| Y |
Y |
Y |
U+0059 |
LATIN CAPITAL LETTER Y |
| Z |
Z |
Z |
U+005A |
LATIN CAPITAL LETTER Z |
| left-square-bracket |
[ |
[ |
U+005B |
LEFT SQUARE BRACKET |
| backslash |
\ |
\\ |
U+005C |
REVERSE SOLIDUS |
| right-square-bracket |
] |
] |
U+005D |
RIGHT SQUARE BRACKET |
| circumflex |
^ |
^ |
U+005E |
CIRCUMFLEX ACCENT |
| underscore |
_ |
_ |
U+005F |
LOW LINE |
| grave-accent |
` |
` |
U+0060 |
GRAVE ACCENT |
| a |
a |
a |
U+0061 |
LATIN SMALL LETTER A |
| b |
b |
b |
U+0062 |
LATIN SMALL LETTER B |
| c |
c |
c |
U+0063 |
LATIN SMALL LETTER C |
| d |
d |
d |
U+0064 |
LATIN SMALL LETTER D |
| e |
e |
e |
U+0065 |
LATIN SMALL LETTER E |
| f |
f |
f |
U+0066 |
LATIN SMALL LETTER F |
| g |
g |
g |
U+0067 |
LATIN SMALL LETTER G |
| h |
h |
h |
U+0068 |
LATIN SMALL LETTER H |
| i |
i |
i |
U+0069 |
LATIN SMALL LETTER I |
| j |
j |
j |
U+006A |
LATIN SMALL LETTER J |
| k |
k |
k |
U+006B |
LATIN SMALL LETTER K |
| l |
l |
l |
U+006C |
LATIN SMALL LETTER L |
| m |
m |
m |
U+006D |
LATIN SMALL LETTER M |
| n |
n |
n |
U+006E |
LATIN SMALL LETTER N |
| o |
o |
o |
U+006F |
LATIN SMALL LETTER O |
| p |
p |
p |
U+0070 |
LATIN SMALL LETTER P |
| q |
q |
q |
U+0071 |
LATIN SMALL LETTER Q |
| r |
r |
r |
U+0072 |
LATIN SMALL LETTER R |
| s |
s |
s |
U+0073 |
LATIN SMALL LETTER S |
| t |
t |
t |
U+0074 |
LATIN SMALL LETTER T |
| u |
u |
u |
U+0075 |
LATIN SMALL LETTER U |
| v |
v |
v |
U+0076 |
LATIN SMALL LETTER V |
| w |
w |
w |
U+0077 |
LATIN SMALL LETTER W |
| x |
x |
x |
U+0078 |
LATIN SMALL LETTER X |
| y |
y |
y |
U+0079 |
LATIN SMALL LETTER Y |
| z |
z |
z |
U+007A |
LATIN SMALL LETTER Z |
| left-brace |
{ |
{ |
U+007B |
LEFT CURLY BRACKET |
| vertical-line |
| |
| |
U+007C |
VERTICAL LINE |
| right-brace |
} |
} |
U+007D |
RIGHT CURLY BRACKET |
| tilde |
~ |
~ |
U+007E |
TILDE |
| Кодировки символов |
| Основы → |
алфавит • текст • набор символов • конверсия |
| Исторические кодировки → |
Докомп.: семафорная • Морзе • Бодо • МТК-2 |
Комп.: 6 бит • УПП • RADIX-50 • EBCDIC • КОИ-7 • ISO 646 |
совре-
менное
8-битное
представ-
ление |
символы → |
ASCII |
не-ASCII |
| 8бит. код.стр. |
Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic |
| ISO 8859 → |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
| Windows → |
1250 1251 1252 1253 1254 1255 1256 1257 1258 | WGL4 |
| IBM&DOS → |
437 • 850 • 852 • 855 • 866 «альт.» • • |
Много-
байтные |
Традиционные → |
DBCS • HTML |
| Unicode → |
UTF-16 • UTF-8 • список символов |
Связанные
темы → |
интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение |
Утилиты: iconv • recode |
Просмотров: 1336
|