Кодирование символов
Содержание:
- Кодировки стандарта ASCII[править]
- Примеры[править]
- [править] Применение
- Наследие и мерчендайзинг
- Физические изменения
- Представление ASCII в ЭВМ
- Решение[править]
- Печатные символы ASCII¶
- Переход к Unicode
- ASCII таблица кодов символов Windows (Win-1251)
- ASCII таблица кодов символов Windows. Описание специальных (управляющих) символов
- Кодировки на основе Unicode
- Проблемы ASCII
- Базовая таблица кодировки ASCII
- Прием
- Описание
- Комментарии
- ASCII символы. Другие символы
Кодировки стандарта ASCII[править]
Определение: |
ASCII — таблицы кодировок, в которых содержатся основные символы (английский алфавит, цифры, знаки препинания, символы национальных алфавитов(свои для каждого региона), служебные символы) и длина кода каждого символа бит. |
бит:
ASCII7 — первая кодировка, пригодная для работы с текстом. Помимо маленьких букв английского алфавита и служебных символов, содержит большие буквы английского языка, цифры, знаки препинания и другие символы.
Кодировки стандарта ASCII ( бит):
- ASCII — первая кодировка, в которой стало возможно использовать символы национальных алфавитов.
- КОИ8-R — первая русская кодировка. Символы кириллицы расположены не в алфавитном порядке. Их разместили в верхнюю половину таблицы так, чтобы позиции кириллических символов соответствовали их фонетическим аналогам в английском алфавите. Это значит, что даже при потере старшего бита каждого символа, например, при проходе через устаревший семибитный модем, текст остается «читаемым».
- CP866 — русская кодировка, использовавшаяся на компьютерах IBM в системе DOS.
- Windows-1251 — русская кодировка, использовавшаяся в русскоязычных версиях операционной системы Windows в начале 90-х годов. Кириллические символы идут в алфавитном порядке. Содержит все символы, встречающиеся в типографике обычного текста (кроме знака ударения).
Структурные свойства таблицыправить
- Цифры 0-9 представляются своими двоичными значениями (например, ), перед которыми стоит . Таким образом, двоично-десятичные числа (BCD) превращаются в ASCII-строку с помощью простого добавления слева к каждому двоично-десятичному полубайту.
- Буквы A-Z верхнего и нижнего регистров различаются в своём представлении только одним битом, что упрощает преобразование регистра и проверку на диапазон. Буквы представляются своими порядковыми номерами в алфавите, записанными в двоичной системе счисления, перед которыми стоит (для букв верхнего регистра) или (для букв нижнего регистра).
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | TAB | LF | VT | FF | CR | SO | SI | |
1 | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2 | ! | » | # | $ | % | & | ‘ | ( | ) | * | + | , | — | . | ||
3 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ; | < | = | > | ? | ||
4 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5 | P | Q | R | S | T | U | V | W | X | Y | Z | \ | ^ | _ | ||
6 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7 | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
Примеры[править]
Если записать строку ‘hello мир’ в файл exampleBOM, а затем сделать его hex-дамп, то можно убедиться в том, что разные символы кодируются разным количеством байт. Например, английские буквы,пробел, знаки препинания и пр. кодируются одним байтом, а русские буквы — двумя
Код на pythonправить
#!/usr/bin/env python #coding:utf-8 import codecs f = open('exampleBOM','w') b = u'hello мир' f.write(codecs.BOM_UTF8) f.write(b.encode('utf-8')) f.close()
hex-дамп файла exampleBOMправить
Символ | BOM | h | e | l | l | o | Пробел | м | и | р | |||||
Код в UNICODE | EF | BB | BF | 68 | 65 | 6C | 6C | 6F | 20 | D0 | BC | D0 | B8 | D1 | 80 |
Код в UTF-8 | 11101111 | 10111011 | 10111111 | 01101000 | 01100101 | 01101100 | 01101100 | 01101111 | 00100000 | 11010000 | 10111100 | 11010000 | 10111000 | 11010001 | 10000000 |
[править] Применение
Логотип одной из берлинских BBS в шрифтах Amiga
Помимо «чистого искусства» (рисунка ради рисунка), аски-арт часто используется в оформительских (*.nfo файлы) целях у варез-групп, у демомейкеров, крякеров и так далее. Довольно часто аски-арт встречается в командной строке некоторых утилит.
Аски-арт часто используется для оформления 1-2-3-строчной подписи в электронных письмах. изображает розочку, изображает оскал.
Во времена BBS аски-арт использовался для графического оформления оных, так как применять другие виды графики возможности не было.
Также используется школотой во . Чересчур много используется. Причём сами они так «рисовать» не умеют, поэтому тырят у друзей или из Интернетов, считая, что так страницы будут смотреться круче.
Наследие и мерчендайзинг
Mercedes-Benz вдохновлен Eva-02 и Asuka
Персонаж Аски использовался для создания нескольких товаров, таких как фигурки в натуральную величину, различные фигурки, гитары, одежда и нижнее белье, некоторые из которых были немедленно распроданы. Ее фигурки также были очень успешными, что значительно увеличило доход франшизы Neon Genesis Evangelion . По словам японского писателя Кадзухиса Фуджи, рисунки Аски стали настолько популярными, что их уже не хватило, и они были снова выставлены на продажу со вторым изданием. В 2008 году БРОККОЛИ выпустила видеоигру под названием Shin Seiki Evangelion: Аянами IKUSEI Keikaku с Asuka Hokan Keikaku (新世紀エヴァンゲリオン綾波育成計画сアスカ補完計画, лит «Neon Genesis Evangelion: Аянами Поднятие проекта с Asuka ДОПОЛНЯЮЩИМ проекта» ) , в котором Игрок берет на себя заботу об Аске и Рей Аянами.
Аска появилась в нескольких видеоигр , основанных на оригинальных анимационные сериях и медиа , не имеющих отношения к франшизе Evangelion, в том числе монстра удар , Super Robot Wars , Сказок Zestiria , головоломки & Dragons , Keri HiME конфет , Призывает совет , Puyopuyo !! Квест и в официальном переходном эпизоде Shinkansen Henkei Robo Shinkalion . Некоторые японские знаменитости изображали ее во время концертов или туров, в том числе Саки Инагаки, Харука Симадзаки и певица Хирона Мурата. В 2019 году Лай Пинь-ю, член Тайваньской демократической прогрессивной партии и депутата Законодательного юаня, провела множество предвыборных митингов с косплеем Аски, получив большую популярность. Персонаж Аски был упомянут и пародирован Excel из Excel Saga, а некоторые из ее эстетических и характерных черт вдохновили других женских персонажей, в том числе Май Шибамуру из Gunparade March , Мичиру Кинушима из Plastic Memories и D.Va из серии игр Overwatch . Японская группа L’Arc-en-Ciel также черпала вдохновение у Аски для песни Anata . В 1997 году Аска было самым популярным именем для новорожденных девочек в Японии.
Физические изменения
В 3.0 Аска физически изменилась либо путём контакта с Ангелом внутри Евы-03, либо же указанного проклятия Евы.
Аска не постарела за 14 лет после Преддверия Третьего удара. Она треснула стекло кулаком в . Во время режима зверя Евы-02 глаза Аски и Мари светились зелёным, а во время режима 777 Евы-02 у Аски не только светится повязка на глаз, но и у самой Аски начинают расти «клыки». Её задние коренные зубы удлиняются и заостряются, по-видимому, в ответ на изменение собственных зубов Евы. Клыки, по-видимому, исчезают после того, как Аска вылезает из Евы.
Светящаяся повязка на глаз Аски
Аска разбивает стекло в комнате для допросов
Отрастающие клыки внутри Евы-02′
Добавить фото в галерею
Неясно, к чему относится проклятие Евы. Это может быть связано с воздействием 9-го Ангела. После спасения Аски от Ангела в 2.0 Рицуко заявила: «Мы не можем исключить возможность психологического загрязнения от Ангела». Некоторые предположили, что это проклятие также может быть связано с длительным воздействием LCL, или Евы, или из-за очень большой глубины капсулы, которую она достигла, когда Ангел заразил Еву-03.
Повязка
Аска теперь носит повязку на левом глазу. Неизвестно точно, что не так с глазом, но что-то под патчем (возможно, всё ещё неповрежденный глаз) светится синим через ткань в двух моментах фильма: после побега Синдзи с Wunder и после того, как Аска активирует режим «777» зверя Евы-02. Кроме того, на глазной повязке, по-видимому, ангелозапечатывающие гексоглифы.
Представление ASCII в ЭВМ
На подавляющем большинстве современных компьютеров, минимально адресуемая единица памяти — байт (размером в 8 бит); поэтому там используются 8-битные, а не 7-битные символы. Обычно символ ASCII расширяют до 8 бит, просто добавляя один нулевой бит в качестве старшего.
На компьютерах IBM/360 однако (в случае использования ASCII) применялся другой метод: 6-й бит (если первым считать самый младший бит) перемещается в 7-й, а бывший 7-й «раздваивается» и копируется и в 8-й бит, и в 6-й. Получается такая таблица:
.1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NUL | SOM | EOA | EOM | EQT | WRU | RU | BELL | BKSP | HT | LF | VT | FF | CR | SO | SI | |
1. | DC | DC1 | DC2 | DC3 | DC4 | ERR | SYNC | LEM | S | S1 | S2 | S3 | S4 | S5 | S6 | S7 |
2. | ||||||||||||||||
3. | ||||||||||||||||
4. | BLANK | ! | « | # | $ | % | & | ‘ | ( | ) | * | + | , | — | . | |
5. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ; | < | = | > | ? | ||
6. | ||||||||||||||||
7. | ||||||||||||||||
8. | ||||||||||||||||
9. | ||||||||||||||||
A. | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
B. | P | Q | R | S | T | U | V | W | X | Y | Z | \ | ↑ | ← | ||
C. | ||||||||||||||||
D. | ||||||||||||||||
E. | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |
F. | p | q | r | s | t | u | v | w | x | y | z | ESC | DEL |
На компьютерах с минимально адресуемой единицей памяти в 36 бит — поначалу использовали 6-битные символы (1 слово = 6 символов). После перехода на ASCII на таких компьютерах в одном слове стали размещать либо 5 семибитовых символов (1 бит оставался лишним), либо 4 девятибитовых символа.
Коды ASCII используются в программировании как промежуточные кроссплатформенные коды нажатых клавиш (в противовес скан-кодам IBM PC и прочим внутренним кодам). Для раскладки клавиатуры QWERTY — таблица кодов выглядит так, как показано в следующей таблице.
Escape 27 |
F1 112 |
F2 113 |
F3 114 |
F4 115 |
F5 116 |
F6 117 |
F7 118 |
F8 119 |
F9 120 |
F10 121 |
F11 122 |
F12 123 |
Print Screen |
Scroll Lock 145 |
Pause 19 |
|||||
` 192 |
1 49 |
2 50 |
3 51 |
4 52 |
5 53 |
6 54 |
7 55 |
8 56 |
9 57 |
48 |
— 189 |
=+ 187 |
Back Space 8 |
Insert 45 |
Home 36 |
Page Up 33 |
Num Lock 144 |
/ доп. 111 |
* доп. 106 |
+ доп. 107 |
Tab 9 |
Q 81 |
W 87 |
E 69 |
R 82 |
T 84 |
Y 89 |
U 85 |
I 73 |
O 79 |
P 80 |
219 |
221 |
Delete 46 |
End 35 |
Page Down 34 |
7 доп. 103 |
8 доп. 104 |
9 доп. 105 |
||
Caps Lock 20 |
A 65 |
S 83 |
D 68 |
F 70 |
G 71 |
H 72 |
J 74 |
K 75 |
L 76 |
186 |
‘ 222 |
Enter 13 |
4 доп. 100 |
5 доп. 101 |
6 доп. 102 |
Enter доп. 13 |
||||
Shift 16 |
Z 90 |
X 88 |
C 67 |
V 86 |
B 66 |
N 78 |
M 77 |
,< 188 |
.> 190 |
191 |
Shift 16 |
\| 220 |
Up 38 |
1 доп. 97 |
2 доп. 98 |
3 доп. 99 |
||||
Ctrl 17 |
super |
Alt 18 |
Space Bar 32 |
Alt 18 |
super |
list |
Ctrl 17 |
Left 37 |
Down 40 |
Right 39 |
Ins/0 доп. 45/96 |
Del/. доп. 46/110 |
Решение[править]
#include <assert.h> #include <stdio.h> int main () { int c; while ((c = getchar ()) != EOF) { printf (" %3d%s", c, (c == '\n' ? "\n" "")); } assert (! ferror (stdin)); return ; }
Главный цикл этой программы напоминает таковой для рассмотренной в разделе Максимум; в частности, мы вновь используем цикл «пока» (). Однако, вместо для чтения чисел, здесь мы обращаемся к функции для чтения отдельных знаков (кодов.) Мы по-прежнему используем — для вывода кода символа в десятичной записи.
С другой стороны, из условия корректности ввода исключается требование возврата именно (как признака исчерпания входного потока), поскольку это условие уже является условием завершения главного цикла. Это различие связано с тем, что в данной программе не требуется опозновать «подходящий» ввод — допустимой является совершенно любая последовательность символов (кодов.) Напротив, мы принимали исключительно целые числа в десятичной записи.
Требование ложности значения функции признака ошибки для стандартного ввода () по завершению главного цикла остается в силе.
Подчеркнем, что диапазон возвращаемых функцией значений — это диапазон «символьного» типа плюс одно значение, а именно — признак конца потока . Как следствие, иногда встречаемое в примерах кода чтение символа из потока непосредственно в переменную типа не вполне корректно — для этих целей следует всегда использовать переменную типа .
Обратите внимание, что сформировать условие «конец потока» при вводе с клавиатуры можно вводом (в зависимости от системы и предполагая настройки по-умолчанию) Control-d или Control-z (также обозначаются C-d, ^D, C-z, ^Z.)
Печатные символы ASCII¶
ASCII символ | HTML Entity Code | Описание |
---|---|---|
  | пробел | |
! | ! | восклицательный знак |
« | " | кавычка |
# | # | знак номера |
$ | $ | знак доллара |
% | % | знак процента |
& | & | амперсанд |
‘ | ' | апостроф |
( | ( | левая скобка |
) | ) | правая скобка |
* | * | звездочка |
+ | + | знак плюс |
, | , | запятая |
— | - | тире |
. | . | точка |
/ | слеш/косая черта | |
0 | цифра 0 | |
1 | 1 | цифра 1 |
2 | 2 | цифра 2 |
3 | 3 | цифра 3 |
4 | 4 | цифра 4 |
5 | 5 | цифра 5 |
6 | 6 | цифра 6 |
7 | 7 | цифра 7 |
8 | 8 | цифра 8 |
9 | 9 | цифра 9 |
: | двоеточие | |
; | ; | точка с запятой |
< | < | меньше |
= | = | равно |
> | > | больше |
? | ? | вопросительный знак |
@ | @ | собачка |
A | A | заглавная A |
B | B | заглавная B |
C | C | заглавная C |
D | D | заглавная D |
E | E | заглавная E |
F | F | заглавная F |
G | G | заглавная G |
H | H | заглавная H |
I | I | заглавная I |
J | J | заглавная J |
K | K | заглавная K |
L | L | заглавная L |
M | M | заглавная M |
N | N | заглавная N |
O | O | заглавная O |
P | P | заглавная P |
Q | Q | заглавная Q |
R | R | заглавная R |
S | S | заглавная S |
T | T | заглавная T |
U | U | заглавная U |
V | V | заглавная V |
W | W | заглавная W |
X | X | заглавная X |
Y | Y | заглавная Y |
Z | Z | заглавная Z |
[ | левая квадратная скобка | |
\ | \ | обратная косая черта |
] | правая квадратная скобка | |
^ | ^ | каретка |
_ | _ | подчеркивание |
` | ` | гравис |
a | a | строчная a |
b | b | строчная b |
c | c | строчная c |
d | d | строчная d |
e | e | строчная e |
f | f | строчная f |
g | g | строчная g |
h | h | строчная h |
i | i | строчная i |
j | j | строчная j |
k | k | строчная k |
l | l | строчная l |
m | m | строчная m |
n | n | строчная n |
o | o | строчная o |
p | p | строчная p |
q | q | строчная q |
r | r | строчная r |
s | s | строчная s |
t | t | строчная t |
u | u | строчная u |
v | v | строчная v |
w | w | строчная w |
x | x | строчная x |
y | y | строчная y |
z | z | строчная z |
{ | { | левая фигурная скобка |
| | | | вертикальная черта |
} | } | правая фигурная скобка |
~ | ~ | тильда |
Таблица кодов управляющих символов ASCII
ASCII Character | HTML Entity Code | Description |
---|---|---|
NUL | � | нуль |
SOH |  | начало заголовка |
STX |  | начало текста |
ETX |  | конец текста |
EOT |  | конец передачи |
ENQ |  | запрос |
ACK |  | подтверждение |
BEL |  | сигнал (звонок) |
BS |  | забой (шаг назад) |
HT | 	 | горизонтальная табуляция |
LF | | перевод строки |
VT |  | вертикальная табуляция |
FF |  | новая страница |
CR | | возврат каретки |
SO |  | включить сдвиг |
SI |  | выключить сдвиг |
DLE |  | ключ связи данных |
DC1 |  | управление устройством 1 |
DC2 |  | управление устройством 2 |
DC3 |  | управление устройством 3 |
DC4 |  | управление устройством 4 |
NAK |  | отрицательное подтверждение |
SYN |  | синхронизация |
ETB |  | конец передаваемого блока |
CAN |  | отказ |
EM |  | конец среды |
SUB |  | замена |
ESC |  | ключ |
FS |  | разделитель файлов |
GS |  | разделитель группы |
RS |  | разделитель записей |
US |  | разделитель модулей |
DEL |  | удаление (rubout) |
Переход к Unicode
Развитие интернета, увеличение количества компьютеров и удешевление памяти привели к тому, что проблемы, которые доставляла путаница в кодировках, стали перевешивать некоторую экономию памяти. Особенно ярко это проявлялось в интернете, когда текст написанный на одном компьютере должен был корректно отображаться на многих других устройствах. Это доставляло огромные проблемы как программистам, которые должны были решать какую кодировку использовать, так и конечным пользователям, которые не могли получить доступ к интересующим их текстам.
В результате в октябре 1991 года появилась первая версия одной общей таблицы символов, названной Unicode. Она включала в себя на тот момент 7161 различный символ из 24 письменностей мира.
В Unicode постепенно добавлялись новые языки и символы. Например, в версию 1.0.1 в середине 1992 года добавили более 20 000 идеограмм китайского, японского и корейского языков. В актуальной на текущий момент версии содержится уже более 143 000 символов.
ASCII таблица кодов символов Windows (Win-1251)
Dec | Hex | Символ | Dec | Hex | Символ | |
000 | 00 | спец. NOP | 128 | 80 | Ђ | |
001 | 01 | спец. SOH | 129 | 81 | Ѓ | |
002 | 02 | спец. STX | 130 | 82 | ‚ | |
003 | 03 | спец. ETX | 131 | 83 | ѓ | |
004 | 04 | спец. EOT | 132 | 84 | „ | |
005 | 05 | спец. ENQ | 133 | 85 | … | |
006 | 06 | спец. ACK | 134 | 86 | † | |
007 | 07 | спец. BEL | 135 | 87 | ‡ | |
008 | 08 | спец. BS | 136 | 88 | € | |
009 | 09 | спец. TAB | 137 | 89 | ‰ | |
010 | 0A | спец. LF | 138 | 8A | Љ | |
011 | 0B | спец. VT | 139 | 8B | ‹ ‹ | |
012 | 0C | спец. FF | 140 | 8C | Њ | |
013 | 0D | спец. CR | 141 | 8D | Ќ | |
014 | 0E | спец. SO | 142 | 8E | Ћ | |
015 | 0F | спец. SI | 143 | 8F | Џ | |
016 | 10 | спец. DLE | 144 | 90 | ђ | |
017 | 11 | спец. DC1 | 145 | 91 | ‘ | |
018 | 12 | спец. DC2 | 146 | 92 | ’ | |
019 | 13 | спец. DC3 | 147 | 93 | “ | |
020 | 14 | спец. DC4 | 148 | 94 | ” | |
021 | 15 | спец. NAK | 149 | 95 | • | |
022 | 16 | спец. SYN | 150 | 96 | – | |
023 | 17 | спец. ETB | 151 | 97 | — | |
024 | 18 | спец. CAN | 152 | 98 | ||
025 | 19 | спец. EM | 153 | 99 | ||
026 | 1A | спец. SUB | 154 | 9A | љ | |
027 | 1B | спец. ESC | 155 | 9B | › | |
028 | 1C | спец. FS | 156 | 9C | њ | |
029 | 1D | спец. GS | 157 | 9D | ќ | |
030 | 1E | спец. RS | 158 | 9E | ћ | |
031 | 1F | спец. US | 159 | 9F | џ | |
032 | 20 | сцеп. SP (Пробел) | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | « | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | ‘ | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Ё | |
041 | 29 | ) | 169 | A9 | ||
042 | 2A | * | 170 | AA | Є | |
043 | 2B | + | 171 | AB | ||
044 | 2C | , | 172 | AC | ¬ | |
045 | 2D | — | 173 | AD | | |
046 | 2E | . | 174 | AE | ||
047 | 2F | 175 | AF | Ї | ||
048 | 30 | 176 | B0 | ° | ||
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | ё | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | 186 | BA | є | ||
059 | 3B | ; | 187 | BB | ||
060 | 3C | < | 188 | BC | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | BE | ѕ | |
063 | 3F | ? | 191 | BF | ї | |
064 | 40 | @ | 192 | C0 | А | |
065 | 41 | A | 193 | C1 | Б | |
066 | 42 | B | 194 | C2 | В | |
067 | 43 | C | 195 | C3 | Г | |
068 | 44 | D | 196 | C4 | Д | |
069 | 45 | E | 197 | C5 | Е | |
070 | 46 | F | 198 | C6 | Ж | |
071 | 47 | G | 199 | C7 | З | |
072 | 48 | H | 200 | C8 | И | |
073 | 49 | I | 201 | C9 | Й | |
074 | 4A | J | 202 | CA | К | |
075 | 4B | K | 203 | CB | Л | |
076 | 4C | L | 204 | CC | М | |
077 | 4D | M | 205 | CD | Н | |
078 | 4E | N | 206 | CE | О | |
079 | 4F | O | 207 | CF | П | |
080 | 50 | P | 208 | D0 | Р | |
081 | 51 | Q | 209 | D1 | С | |
082 | 52 | R | 210 | D2 | Т | |
083 | 53 | S | 211 | D3 | У | |
084 | 54 | T | 212 | D4 | Ф | |
085 | 55 | U | 213 | D5 | Х | |
086 | 56 | V | 214 | D6 | Ц | |
087 | 57 | W | 215 | D7 | Ч | |
088 | 58 | X | 216 | D8 | Ш | |
089 | 59 | Y | 217 | D9 | Щ | |
090 | 5A | Z | 218 | DA | Ъ | |
091 | 5B | 219 | DB | Ы | ||
092 | 5C | \ | 220 | DC | Ь | |
093 | 5D | 221 | DD | Э | ||
094 | 5E | ^ | 222 | DE | Ю | |
095 | 5F | _ | 223 | DF | Я | |
096 | 60 | ` | 224 | E0 | а | |
097 | 61 | a | 225 | E1 | б | |
098 | 62 | b | 226 | E2 | в | |
099 | 63 | c | 227 | E3 | г | |
100 | 64 | d | 228 | E4 | д | |
101 | 65 | e | 229 | E5 | е | |
102 | 66 | f | 230 | E6 | ж | |
103 | 67 | g | 231 | E7 | з | |
104 | 68 | h | 232 | E8 | и | |
105 | 69 | i | 233 | E9 | й | |
106 | 6A | j | 234 | EA | к | |
107 | 6B | k | 235 | EB | л | |
108 | 6C | l | 236 | EC | м | |
109 | 6D | m | 237 | ED | н | |
110 | 6E | n | 238 | EE | о | |
111 | 6F | o | 239 | EF | п | |
112 | 70 | p | 240 | F0 | р | |
113 | 71 | q | 241 | F1 | с | |
114 | 72 | r | 242 | F2 | т | |
115 | 73 | s | 243 | F3 | у | |
116 | 74 | t | 244 | F4 | ф | |
117 | 75 | u | 245 | F5 | х | |
118 | 76 | v | 246 | F6 | ц | |
119 | 77 | w | 247 | F7 | ч | |
120 | 78 | x | 248 | F8 | ш | |
121 | 79 | y | 249 | F9 | щ | |
122 | 7A | z | 250 | FA | ъ | |
123 | 7B | { | 251 | FB | ы | |
124 | 7C | | | 252 | FC | ь | |
125 | 7D | } | 253 | FD | э | |
126 | 7E | ~ | 254 | FE | ю | |
127 | 7F | Спец. DEL | 255 | FF | я |
ASCII таблица кодов символов Windows. Описание специальных (управляющих) символов
Следует отметить, что первоначально управляющие символы таблицы ASCII использовались
для обеспечения обмена данными по телетайпу, ввода данных с перфоленты и
для простейшего управления внешними устройствами.
В настоящее время большинство из управляющих символов ASCII таблицы
уже не несут эту нагрузку и могут использоваться для иных целей.
Код | Описание |
---|---|
NUL, 00 | Null, пустой |
SOH, 01 | Start Of Heading, начало заголовка |
STX, 02 | Start of TeXt, начало текста. |
ETX, 03 | End of TeXt, конец текста |
EOT, 04 | End of Transmission, конец передачи |
ENQ, 05 | Enquire. Прошу подтверждения |
ACK, 06 | Acknowledgement. Подтверждаю |
BEL, 07 | Bell, звонок |
BS, 08 | Backspace, возврат на один символ назад |
TAB, 09 | Tab, горизонтальная табуляция |
LF, 0A | Line Feed, перевод строки. Сейчас в большинстве языков программирования обозначается как \n |
VT, 0B | Vertical Tab, вертикальная табуляция. |
FF, 0C | Form Feed, прогон страницы, новая страница |
CR, 0D | Carriage Return, возврат каретки. Сейчас в большинстве языков программирования обозначается как \r |
SO, 0E | Shift Out, изменить цвет красящей ленты в печатающем устройстве |
SI, 0F | Shift In, вернуть цвет красящей ленты в печатающем устройстве обратно |
DLE, 10 | Data Link Escape, переключение канала на передачу данных |
DC1, 11 DC2, 12DC3, 13DC4, 14 | Device Control, символы управления устройствами |
NAK, 15 | Negative Acknowledgment, не подтверждаю. |
SYN, 16 | Synchronization. Символ синхронизации |
ETB, 17 | End of Text Block, конец текстового блока |
CAN, 18 | Cancel, отмена переданного ранее |
EM, 19 | End of Medium, конец носителя данных |
SUB, 1A | Substitute, подставить. Ставится на месте символа, значение которого было потеряно или испорчено при передаче |
ESC, 1B | Escape Управляющая последовательность |
FS, 1C | File Separator, разделитель файлов |
GS, 1D | Group Separator, разделитель групп |
RS, 1E | Record Separator, разделитель записей |
US, 1F | Unit Separator, разделитель юнитов |
DEL, 7F | Delete, стереть последний символ. |
Кодировки на основе Unicode
Unicode можно себе представить как огромную таблицу символов. В памяти компьютера записываются не сами символы, а номера из таблицы. Записывать их можно разными способами. Именно для этого на основе Unicode разработаны несколько кодировок, которые отличаются способом записи номера символа Unicode в виде набора байт. Они называются UTF — Unicode Transformation Format. Есть кодировки постоянной длины, например, UTF-32, в которой номер любого символа из таблицы Unicode занимает ровно 4 байта. Однако наибольшую популярность получила UTF-8 — кодировка с переменным числом байт. Она позволяет кодировать символы так, что наиболее распространённые символы занимают 1-2 байта, и только редко встречающиеся символы могут использовать по 4 байта. Например, все символы таблицы ASCII занимают ровно по одному байту, поэтому текст, написанный на английском языке с использованием кодировки UTF-8, будет занимать столько же места, как и текст, написанный с использованием таблицы символов ASCII.
На сегодняшний день Unicode является основной кодировкой, которую используют в работе все, кто связан с компьютерами и текстами. Unicode позволяет использовать сотни тысяч различных символов и отображать их одинаково на всех устройствах от мобильных телефонов до компьютеров на космических станциях.
Проблемы ASCII
Поскольку количество элементов даже в расширенной таблице не превышало 256, возможность вмещения в одну кодировку нескольких различных письменностей отсутствовала. В 90-е годы в Рунете появилась проблема «крокозябр», когда тексты, набранные русскими символами ASCII, отображались некорректно.
Проблема заключалась в несоответствии кодов различных вариантов ASCII друг другу. Вспомним, что на позициях 128-255 могли располагаться различные знаки, и при смене одной кириллической кодировки на другую все буквы текста заменялись на другие, имеющие идентичный номер в другой версии кодировки.
Базовая таблица кодировки ASCII
32 пробел | 48 0 | 64 @ | 80 P | 96 ` | 112 p |
33 ! | 49 1 | 65 A | 81 Q | 97 a | 113 q |
34 “ | 50 2 | 66 B | 82 R | 98 b | 114 r |
35 # | 51 3 | 67 C | 83 S | 99 c | 115 s |
36 $ | 52 4 | 68 D | 84 T | 100 d | 116 t |
37 % | 53 5 | 69 E | 85 U | 101 e | 117 u |
38 & | 54 6 | 70 F | 86 V | 102 f | 118 v |
39 ‘ | 55 7 | 71 G | 87 W | 103 g | 119 w |
40 ( | 56 8 | 72 H | 88 X | 104 h | 120 x |
41 ) | 57 9 | 73 I | 89 Y | 105 i | 121 y |
42 * | 58 : | 74 J | 90 Z | 106 j | 122 z |
43 + | 59 ; | 75 K | 91 [ | 107 k | 123 { |
44 , | 60 < | 76 L | 92 \ | 108 l | 124 | |
45 — | 61 = | 77 M | 93 ] | 109 m | 125 } |
46 . | 62 > | 78 N | 94 ^ | 110 n | 126 ~ |
47 / | 63 ? | 79 O | 95 _ | 111 o | 127 |
Символы с номерами от 128 до 255 представляют собой таблицу расширения и варьируются в зависимости от набора скриптов, представленных кодировкой символов. Набор символов таблицы расширения различается в зависимости от выбранной кодовой страницы:
Прием
Косплеер в роли Аски на выставке Marseilles Japan Expo 2011
Аска участвовала в различных опросах лучших аниме-пилотов и женских аниме-персонажей, оказавшись популярной как среди женской, так и среди мужской аудитории. В 1996 году она заняла третье место среди «самых популярных женских персонажей на данный момент» в обзоре Гран-при аниме от Animage mangazine, после Рей Аянами и Хикару Шидо из Magic Knight Rayearth . В 1997 и 1998 годах на Гран-при аниме ей также удалось остаться в десятке лучших женских персонажей; в 1997 году она заняла четвертое место, а в 1998 году — шестое. В ежемесячных опросах популярности Animage Аска также заняла третье место в августе 1996 года и седьмое в июле 1998 года. Ее популярность возросла после выхода второго фильма Rebuild of Evangelion ; в августе и сентябре 2009 года она вышла на первое место и оставалась самым популярным женским персонажем Neon Genesis Evangelion в рейтинге популярности журнала Newtype , а в октябре она заняла десятое место. В опросе Newtype, проведенном в марте 2010 года, она была признана третьим по популярности женским аниме-персонажем 1990-х годов сразу после Рей Аянами и Усаги Цукино из Pretty Guardian Sailor Moon . В 2017 году она заняла 16-е место среди персонажей аниме, с которыми читатели аниме предпочли бы умереть, чем выйти замуж.
Ее строчка «Ты дурак?» стала широко использоваться среди хардкорных фанатов с момента ее первого появления в 8-м эпизоде. Ценив ее за «хорошую дозу комического облегчения» Евангелиону , аниме-критик Пит Харкофф назвал ее «надоедливой соплей». Рафаэль Си из THEM Anime Reviews, который нашел характеристику Neon Genesis Evangelion «немного клише или временами просто раздражающей», презирал Аску за ее высокомерное отношение. Редактор Anime News Network Линзи Ловеридж заняла свое седьмое место среди «худших неудачников» в истории аниме. Критик IGN Рэмси Айслер назвал ее 13-м величайшим персонажем аниме всех времен за реалистичность ее персонажей, сказав: «Она трагический персонаж и полная крушение поезда, но именно это делает ее такой привлекательной, потому что мы просто не можем помогите, но наблюдайте, как разворачивается эта прекрасная катастрофа «. CBR включил ее в число лучших женщин-пилотов аниме, назвав ее «лучшим классическим цундэрэ в аниме сёнэн» и «одним из самых захватывающих персонажей аниме».
По словам критика Джея Телотта, Аска «является первым заслуживающим доверия многонациональным персонажем в истории японской SFTV». Crunchyroll также похвалил ее реализм и оригинальность, а Чарапедия написала: «Описание ее психологии реалистично и без принуждения, в отличие от многих других аниме-персонажей. Ее добрая и детская сторона — настоящая причина обаяния Аски». Бой Аски против евангелионов массового производства в «Конец Евангелиона» был особенно хорошо принят критиками, которые считали, что это был ее решающий момент, поскольку в остальном она остается статичной на протяжении большей части фильма. Также похвалили Тиффани Грант за роль актрисы озвучивания Аски на английском языке. Майк Крэндол из Anime News Network заявил, что Грант был «ее старым пылким я в роли Аски». Терон Мартин написала, что изображение Аски в Evangelion: 2.0 You Can (Not) Advance «отличается от начального», заявив, что она даже более антисоциальна, чем в оригинальном аниме. Мартин также написал, что, несмотря на то, что она кажется «наиболее социально адаптированным пилотом Евы в сериале», Аска из Evangelion 2.0 «не претендует на то, чтобы кому-то понравиться», и что она «кажется, в такой же степени мотивирована тем, что сделает свою будущую карьеру. в Nerv, как и она из-за своей личной гордости ». Эрик Суррелл также прокомментировал роль Аски в Evangelion: 2.0 You Can (Not) Advance, заявив, что «прибытие и внезапное увольнение Аски было шокирующим и депрессивным, особенно учитывая, насколько она была неотъемлемой частью оригинального Evangelion ». Саймон Абрамс из Slant Magazine , рецензирующий Evangelion: 2.0 You Can (Not) Advance , негативно оценил новые отношения Синдзи и Аски, «что прискорбно, потому что эта связь должна иметь возможность расти в свое время».
Описание
Аска поглощается ядром девятого Ангела
Ее внешний вид практически не изменился по сравнению с сериалом (цвет волос теперь каштановый, а не рыжий), но её характер и личность заметно отличаются. Прежде всего, она разговаривает и играет с куклой (в то время как Аска Сорью глубоко ненавидела их), когда была в плохом настроении (в первую ночь у Мисато). Она даже готовит еду, чтобы попытаться произвести впечатление на Синдзи, узнав о планах Рей об ужине вместе с Гэндо и Синдзи
Она не проявляет никакого интереса к Кадзи и ревнует, когда Синдзи обращает внимание на Рей.
Аска завтракает вместе с Хикари, но не становится с ней хорошими друзьями. Она выглядит одинокой, которая играет в свою игровую консоль «Wonderswan», блокируя окружающих, подобно тому, как Синдзи сбегает от мира с помощью SDAT.
Она считает Рей и Синдзи своими соперниками в пилотировании (кроме того, она относится к Рей как к сопернику на любовном фронте, хотя Рей не признаёт этого), но постепенно смягчается. В случае Синдзи Аска позволяет ему называть её по имени (хотя она называет его «глупым Синдзи» вместо «папенькин сыночек»). В случае с Рей (которую Сикинами называет «любимицей командующего») Аска решает быть лётчиком-испытателем для злополучной Евы-03, чтобы Рей смогла провести свой званый обед в попытке сблизить Синдзи и Гэндо.
В конце концов, Аска признаётся Мисато, что ей не нужны друзья и она предпочитает оставаться в одиночестве. Но через взаимодействие с другими она начала понимать, что быть с людьми — это хорошо. После этого, Аска осознаёт, что она улыбается, сидя в капсуле Евангелиона: Модуля-03 во время запуска. девятый Ангел заражает Еву-03 и в конечном счете берёт над ней контроль. Капсула Модуля-03 ломается во рту Евы-01. Аска по-прежнему жива и находится под системой жизнеобеспечения; Рицуко называет её «ценным образцом». Тем не менее, Синдзи крайне возмущён решением Гэндо использовать систему псевдопилота, после чего узнаёт о состоянии Аски от Мисато и временно покидает Nerv.
Аска после таймскипа
Аска возвращается в «Evangelion 3.0: You Can (Not) Redo» в новом костюме и с повязкой на левом глазе, показанной в превью к 3.0 после титров 2.0. По словам Юко Миямуры, теперь Аска представляет из себя профессионального наёмника. Интересно, что в фильме она тематически ассоциируется с кошками: носит как козырёк, так и шлем с ушками, а в режиме зверя Ева-02 перевоплощается в гигантского саблезубого кота. Никто из других пилотов не связан с животными таким образом, поэтому неясно, что этот мотив может означать.
В третьем фильме Аске двадцать восемь, но её тело по-прежнему в возрасте четырнадцати лет (из-за явления, которое она называет «проклятием Евы»). Аска освобождает тессеракт, хранящий Евангелион-01 и служит пилотом Евы-02, на этот раз под управлением Wille. Она сильно обижена на Синдзи за то, что тот инициировал Преддверие Третьего удара. Аска даже сражается с ним и Каору, находящимися в Еве-13. Во время противостояния напавшему на Wunder Mark.09 она вынуждена активировать в Еве систему самоуничтожения, чтобы победить, после чего катапультируется, а её Еву разносит на части взрывом, уничтожившим Mark.09. В конце фильма Аска вытаскивает Синдзи из контактной капсулы и направляется с ним и клоном Рей на поиски людей.
Комментарии
Символы ASCII ограничены самыми низкими 128 символами Юникода от U + 0000 до U + 007F.ASCII characters are limited to the lowest 128 Unicode characters, from U+0000 to U+007F.
При выборе кодировки ASCII для приложения учитывайте следующее.When selecting the ASCII encoding for your app, consider the following:
Кодировка ASCII обычно подходит для протоколов, требующих ASCII.The ASCII encoding is usually appropriate for protocols that require ASCII.
Если требуется 8-разрядная кодировка (которая иногда ошибочно называется ASCII), рекомендуется использовать кодировку UTF-8 в кодировке ASCII.If you requires 8-bit encoding (which is sometimes incorrectly referred to as «ASCII»), the UTF-8 encoding is recommended over the ASCII encoding. Для символов 0-7F результаты идентичны, но использование UTF-8 позволяет избежать потери данных, разрешая представление всех символов Юникода, которые можно представить.For the characters 0-7F, the results are identical, but use of UTF-8 avoids data loss by allowing representation of all Unicode characters that are representable
Обратите внимание, что кодировка ASCII имеет 8-разрядную неоднозначность, которая может допускать вредоносное использование, но кодировка UTF-8 устраняет неоднозначность в восьмом бите.Note that the ASCII encoding has an 8th bit ambiguity that can allow malicious use, but the UTF-8 encoding removes ambiguity about the 8th bit.
До .NET Framework версии 2,0 .NET Framework допускает подмену, игнорируя восьмой бит.Prior to .NET Framework version 2.0, .NET Framework allowed spoofing by ignoring the 8th bit. Начиная с .NET Framework 2,0, в процессе декодирования кодовые точки, не входящие в набор ASCII, переходят назад.Beginning with .NET Framework 2.0, non-ASCII code points fall back during decoding.
ASCIIEncodingОбъект, возвращаемый этим свойством, может не иметь соответствующего поведения для приложения.The ASCIIEncoding object that is returned by this property might not have the appropriate behavior for your app. Он использует резервный вариант замены, чтобы заменить каждую строку, которую не удается закодировать, и каждый байт, который не может быть декодирован символом вопросительного знака («?»).It uses replacement fallback to replace each string that it cannot encode and each byte that it cannot decode with a question mark («?») character. Вместо этого можно вызвать метод для создания экземпляра ASCIIEncoding объекта, резерв которого является либо EncoderFallbackException или DecoderFallbackException , как показано в следующем примере.Instead, you can call the method to instantiate an ASCIIEncoding object whose fallback is either an EncoderFallbackException or a DecoderFallbackException, as the following example illustrates.
ASCII символы. Другие символы
NUL
Null. (No character — нет данных). Используется для передачи в случае отсутствия данных.
BEL
Bell (Звонок). Используется для управления устройствами сигнализации.
SO
Shift Out. Указывает, что все последующие кодовые комбинации должны интерпретироваться согласно внешнему набору символов до прихода символа SI.
SI
Shift In. Указывает, что последующие кодовые комбинации должны интерпретироваться согласно стандартному набору символов.
DLE
Data Link Escape (Переключение). Изменение значения идущих следом символов. Используется для дополнительного контроля или для передачи произвольной комбинации бит.
DC1, DC2, DC3, DC4
Device Controls (Контроль Устройства). Символы для управления вспомогательными устройствами (специальными функциями).
CAN
Cancel (Отмена). Указывает, что данные, который предшествовали этому символу в сообщении или блоке, должны игнорироваться (обычно в случае обнаружения ошибки).
EM
End of Medium (Конец Носителя). Указывает на физический конец ленты или другого носителя информации
SUB
Substitute (Заместитель). Используется для подмены ошибочного или недопустимого символа.
ESC
Escape (Расширение). Используется для расширения кода, указывая на то, что последующий символ имеет альтернативное значение.
(sp)
Space (Пробел). Непечатаемый символ для разделения слов или перемещения механизма печати или курсора дисплея вперед на одну позицию.
DEL
Delete (Удаление). Используется для удаления (стирания) предыдущего знака в сообщении