|
|
Компьютеры - Переносимый набор символов23 января 2011
Переносимый набор символов — набор из 103 символов, которые, согласно стандарту POSIX, должны присутствовать в любой используемой кодировке. Включает в себя все печатные символы US-ASCII и часть управляющих. Является базовым алфавитом для практически всех современных языков программирования.
На коды символов из переносимого набора накладываются следующие ограничения:
- NUL должен быть символом, где все биты установлены в 0.
- Коды десятичных цифр 0—9 должны идти в возрастающем порядке, причём коды двух соседних цифр должны отличаться на единицу.
- Коды всех символов из этого набора должны быть представимы одним байтом.
- Если для представления символов в языке C используется тип char, то коды символов из этого набора обязательно должны быть неотрицательными.
название |
глиф |
строка
Си |
Юникод |
название в Юникоде |
NUL |
|
\0 |
U+0000 |
NULL |
alert |
|
\a |
U+0007 |
BELL |
backspace |
|
\b |
U+0008 |
BACKSPACE |
tab |
|
\t |
U+0009 |
CHARACTER TABULATION |
carriage-return |
|
\r |
U+000D |
CARRIAGE RETURN |
newline |
|
\n |
U+000A |
LINE FEED |
vertical-tab |
|
\v |
U+000B |
LINE TABULATION |
form-feed |
|
\f |
U+000C |
FORM FEED |
space |
|
|
U+0020 |
SPACE |
exclamation-mark |
! |
! |
U+0021 |
EXCLAMATION MARK |
quotation-mark |
" |
\" |
U+0022 |
QUOTATION MARK |
number-sign |
# |
# |
U+0023 |
NUMBER SIGN |
dollar-sign |
$ |
$ |
U+0024 |
DOLLAR SIGN |
percent-sign |
% |
% |
U+0025 |
PERCENT SIGN |
ampersand |
& |
& |
U+0026 |
AMPERSAND |
apostrophe |
' |
\' |
U+0027 |
APOSTROPHE |
left-parenthesis |
( |
( |
U+0028 |
LEFT PARENTHESIS |
right-parenthesis |
) |
) |
U+0029 |
RIGHT PARENTHESIS |
asterisk |
* |
* |
U+002A |
ASTERISK |
plus-sign |
+ |
+ |
U+002B |
PLUS SIGN |
comma |
, |
, |
U+002C |
COMMA |
hyphen |
- |
- |
U+002D |
HYPHEN-MINUS |
period |
. |
. |
U+002E |
FULL STOP |
slash |
/ |
/ |
U+002F |
SOLIDUS |
zero |
0 |
0 |
U+0030 |
DIGIT ZERO |
one |
1 |
1 |
U+0031 |
DIGIT ONE |
two |
2 |
2 |
U+0032 |
DIGIT TWO |
three |
3 |
3 |
U+0033 |
DIGIT THREE |
four |
4 |
4 |
U+0034 |
DIGIT FOUR |
five |
5 |
5 |
U+0035 |
DIGIT FIVE |
six |
6 |
6 |
U+0036 |
DIGIT SIX |
seven |
7 |
7 |
U+0037 |
DIGIT SEVEN |
eight |
8 |
8 |
U+0038 |
DIGIT EIGHT |
nine |
9 |
9 |
U+0039 |
DIGIT NINE |
colon |
: |
: |
U+003A |
COLON |
semicolon |
; |
; |
U+003B |
SEMICOLON |
less-than-sign |
< |
< |
U+003C |
LESS-THAN SIGN |
equals-sign |
= |
= |
U+003D |
EQUALS SIGN |
greater-than-sign |
> |
> |
U+003E |
GREATER-THAN SIGN |
question-mark |
? |
? |
U+003F |
QUESTION MARK |
commercial-at |
@ |
@ |
U+0040 |
COMMERCIAL AT |
A |
A |
A |
U+0041 |
LATIN CAPITAL LETTER A |
B |
B |
B |
U+0042 |
LATIN CAPITAL LETTER B |
C |
C |
C |
U+0043 |
LATIN CAPITAL LETTER C |
D |
D |
D |
U+0044 |
LATIN CAPITAL LETTER D |
E |
E |
E |
U+0045 |
LATIN CAPITAL LETTER E |
F |
F |
F |
U+0046 |
LATIN CAPITAL LETTER F |
G |
G |
G |
U+0047 |
LATIN CAPITAL LETTER G |
H |
H |
H |
U+0048 |
LATIN CAPITAL LETTER H |
I |
I |
I |
U+0049 |
LATIN CAPITAL LETTER I |
J |
J |
J |
U+004A |
LATIN CAPITAL LETTER J |
K |
K |
K |
U+004B |
LATIN CAPITAL LETTER K |
L |
L |
L |
U+004C |
LATIN CAPITAL LETTER L |
M |
M |
M |
U+004D |
LATIN CAPITAL LETTER M |
N |
N |
N |
U+004E |
LATIN CAPITAL LETTER N |
O |
O |
O |
U+004F |
LATIN CAPITAL LETTER O |
P |
P |
P |
U+0050 |
LATIN CAPITAL LETTER P |
Q |
Q |
Q |
U+0051 |
LATIN CAPITAL LETTER Q |
R |
R |
R |
U+0052 |
LATIN CAPITAL LETTER R |
S |
S |
S |
U+0053 |
LATIN CAPITAL LETTER S |
T |
T |
T |
U+0054 |
LATIN CAPITAL LETTER T |
U |
U |
U |
U+0055 |
LATIN CAPITAL LETTER U |
V |
V |
V |
U+0056 |
LATIN CAPITAL LETTER V |
W |
W |
W |
U+0057 |
LATIN CAPITAL LETTER W |
X |
X |
X |
U+0058 |
LATIN CAPITAL LETTER X |
Y |
Y |
Y |
U+0059 |
LATIN CAPITAL LETTER Y |
Z |
Z |
Z |
U+005A |
LATIN CAPITAL LETTER Z |
left-square-bracket |
[ |
[ |
U+005B |
LEFT SQUARE BRACKET |
backslash |
\ |
\\ |
U+005C |
REVERSE SOLIDUS |
right-square-bracket |
] |
] |
U+005D |
RIGHT SQUARE BRACKET |
circumflex |
^ |
^ |
U+005E |
CIRCUMFLEX ACCENT |
underscore |
_ |
_ |
U+005F |
LOW LINE |
grave-accent |
` |
` |
U+0060 |
GRAVE ACCENT |
a |
a |
a |
U+0061 |
LATIN SMALL LETTER A |
b |
b |
b |
U+0062 |
LATIN SMALL LETTER B |
c |
c |
c |
U+0063 |
LATIN SMALL LETTER C |
d |
d |
d |
U+0064 |
LATIN SMALL LETTER D |
e |
e |
e |
U+0065 |
LATIN SMALL LETTER E |
f |
f |
f |
U+0066 |
LATIN SMALL LETTER F |
g |
g |
g |
U+0067 |
LATIN SMALL LETTER G |
h |
h |
h |
U+0068 |
LATIN SMALL LETTER H |
i |
i |
i |
U+0069 |
LATIN SMALL LETTER I |
j |
j |
j |
U+006A |
LATIN SMALL LETTER J |
k |
k |
k |
U+006B |
LATIN SMALL LETTER K |
l |
l |
l |
U+006C |
LATIN SMALL LETTER L |
m |
m |
m |
U+006D |
LATIN SMALL LETTER M |
n |
n |
n |
U+006E |
LATIN SMALL LETTER N |
o |
o |
o |
U+006F |
LATIN SMALL LETTER O |
p |
p |
p |
U+0070 |
LATIN SMALL LETTER P |
q |
q |
q |
U+0071 |
LATIN SMALL LETTER Q |
r |
r |
r |
U+0072 |
LATIN SMALL LETTER R |
s |
s |
s |
U+0073 |
LATIN SMALL LETTER S |
t |
t |
t |
U+0074 |
LATIN SMALL LETTER T |
u |
u |
u |
U+0075 |
LATIN SMALL LETTER U |
v |
v |
v |
U+0076 |
LATIN SMALL LETTER V |
w |
w |
w |
U+0077 |
LATIN SMALL LETTER W |
x |
x |
x |
U+0078 |
LATIN SMALL LETTER X |
y |
y |
y |
U+0079 |
LATIN SMALL LETTER Y |
z |
z |
z |
U+007A |
LATIN SMALL LETTER Z |
left-brace |
{ |
{ |
U+007B |
LEFT CURLY BRACKET |
vertical-line |
| |
| |
U+007C |
VERTICAL LINE |
right-brace |
} |
} |
U+007D |
RIGHT CURLY BRACKET |
tilde |
~ |
~ |
U+007E |
TILDE |
Кодировки символов |
Основы → |
алфавит • текст • набор символов • конверсия |
Исторические кодировки → |
Докомп.: семафорная • Морзе • Бодо • МТК-2 |
Комп.: 6 бит • УПП • RADIX-50 • EBCDIC • КОИ-7 • ISO 646 |
совре-
менное
8-битное
представ-
ление |
символы → |
ASCII |
не-ASCII |
8бит. код.стр. |
Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic |
ISO 8859 → |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
Windows → |
1250 1251 1252 1253 1254 1255 1256 1257 1258 | WGL4 |
IBM&DOS → |
437 • 850 • 852 • 855 • 866 «альт.» • • |
Много-
байтные |
Традиционные → |
DBCS • HTML |
Unicode → |
UTF-16 • UTF-8 • список символов |
Связанные
темы → |
интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение |
Утилиты: iconv • recode |
Просмотров: 1196
|