Кодирование символов

Кодировки стандарта ASCII[править]

Определение:
ASCII — таблицы кодировок, в которых содержатся основные символы (английский алфавит, цифры, знаки препинания, символы национальных алфавитов(свои для каждого региона), служебные символы) и длина кода каждого символа бит.

бит:

ASCII7 — первая кодировка, пригодная для работы с текстом. Помимо маленьких букв английского алфавита и служебных символов, содержит большие буквы английского языка, цифры, знаки препинания и другие символы.

Кодировки стандарта ASCII ( бит):

  • ASCII — первая кодировка, в которой стало возможно использовать символы национальных алфавитов.
  • КОИ8-R — первая русская кодировка. Символы кириллицы расположены не в алфавитном порядке. Их разместили в верхнюю половину таблицы так, чтобы позиции кириллических символов соответствовали их фонетическим аналогам в английском алфавите. Это значит, что даже при потере старшего бита каждого символа, например, при проходе через устаревший семибитный модем, текст остается «читаемым».
  • CP866 — русская кодировка, использовавшаяся на компьютерах IBM в системе DOS.
  • Windows-1251 — русская кодировка, использовавшаяся в русскоязычных версиях операционной системы Windows в начале 90-х годов. Кириллические символы идут в алфавитном порядке. Содержит все символы, встречающиеся в типографике обычного текста (кроме знака ударения).

Структурные свойства таблицыправить

  • Цифры 0-9 представляются своими двоичными значениями (например, ), перед которыми стоит . Таким образом, двоично-десятичные числа (BCD) превращаются в ASCII-строку с помощью простого добавления слева к каждому двоично-десятичному полубайту.
  • Буквы A-Z верхнего и нижнего регистров различаются в своём представлении только одним битом, что упрощает преобразование регистра и проверку на диапазон. Буквы представляются своими порядковыми номерами в алфавите, записанными в двоичной системе счисления, перед которыми стоит (для букв верхнего регистра) или (для букв нижнего регистра).
  1 2 3 4 5 6 7 8 9 A B C D E F
NUL SOH STX ETX EOT ENQ ACK BEL BS TAB LF VT FF CR SO SI
1 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2    ! » # $  % & ( ) * + , .
3 1 2 3 4 5 6 7 8 9  ; < = >  ?
4 @ A B C D E F G H I J K L M N O
5 P Q R S T U V W X Y Z \ ^ _
6 ` a b c d e f g h i j k l m n o
7 p q r s t u v w x y z { | } ~ DEL

Примеры[править]

Если записать строку ‘hello мир’ в файл exampleBOM, а затем сделать его hex-дамп, то можно убедиться в том, что разные символы кодируются разным количеством байт. Например, английские буквы,пробел, знаки препинания и пр. кодируются одним байтом, а русские буквы — двумя

Код на pythonправить

#!/usr/bin/env python
#coding:utf-8
import codecs
f = open('exampleBOM','w')
b = u'hello мир'
f.write(codecs.BOM_UTF8)
f.write(b.encode('utf-8'))
f.close()

hex-дамп файла exampleBOMправить

Символ BOM h e l l o Пробел м и р
Код в UNICODE EF BB BF 68 65 6C 6C 6F 20 D0 BC D0 B8 D1 80
Код в UTF-8 11101111 10111011 10111111 01101000 01100101 01101100 01101100 01101111 00100000 11010000 10111100 11010000 10111000 11010001 10000000

[править] Применение

Логотип одной из берлинских BBS в шрифтах Amiga

Помимо «чистого искусства» (рисунка ради рисунка), аски-арт часто используется в оформительских (*.nfo файлы) целях у варез-групп, у демомейкеров, крякеров и так далее. Довольно часто аски-арт встречается в командной строке некоторых утилит.

Аски-арт часто используется для оформления 1-2-3-строчной подписи в электронных письмах. изображает розочку, изображает оскал.

Во времена BBS аски-арт использовался для графического оформления оных, так как применять другие виды графики возможности не было.

Также используется школотой во . Чересчур много используется. Причём сами они так «рисовать» не умеют, поэтому тырят у друзей или из Интернетов, считая, что так страницы будут смотреться круче.

Наследие и мерчендайзинг

Mercedes-Benz вдохновлен Eva-02 и Asuka

Персонаж Аски использовался для создания нескольких товаров, таких как фигурки в натуральную величину, различные фигурки, гитары, одежда и нижнее белье, некоторые из которых были немедленно распроданы. Ее фигурки также были очень успешными, что значительно увеличило доход франшизы Neon Genesis Evangelion . По словам японского писателя Кадзухиса Фуджи, рисунки Аски стали настолько популярными, что их уже не хватило, и они были снова выставлены на продажу со вторым изданием. В 2008 году БРОККОЛИ выпустила видеоигру под названием Shin Seiki Evangelion: Аянами IKUSEI Keikaku с Asuka Hokan Keikaku (新世紀エヴァンゲリオン綾波育成計画сアスカ補完計画, лит «Neon Genesis Evangelion: Аянами Поднятие проекта с Asuka ДОПОЛНЯЮЩИМ проекта» ) , в котором Игрок берет на себя заботу об Аске и Рей Аянами.

Аска появилась в нескольких видеоигр , основанных на оригинальных анимационные сериях и медиа , не имеющих отношения к франшизе Evangelion, в том числе монстра удар , Super Robot Wars , Сказок Zestiria , головоломки & Dragons , Keri HiME конфет , Призывает совет , Puyopuyo !! Квест и в официальном переходном эпизоде Shinkansen Henkei Robo Shinkalion . Некоторые японские знаменитости изображали ее во время концертов или туров, в том числе Саки Инагаки, Харука Симадзаки и певица Хирона Мурата. В 2019 году Лай Пинь-ю, член Тайваньской демократической прогрессивной партии и депутата Законодательного юаня, провела множество предвыборных митингов с косплеем Аски, получив большую популярность. Персонаж Аски был упомянут и пародирован Excel из Excel Saga, а некоторые из ее эстетических и характерных черт вдохновили других женских персонажей, в том числе Май Шибамуру из Gunparade March , Мичиру Кинушима из Plastic Memories и D.Va из серии игр Overwatch . Японская группа L’Arc-en-Ciel также черпала вдохновение у Аски для песни Anata . В 1997 году Аска было самым популярным именем для новорожденных девочек в Японии.

Физические изменения

В 3.0 Аска физически изменилась либо путём контакта с Ангелом внутри Евы-03, либо же указанного проклятия Евы.

Аска не постарела за 14 лет после Преддверия Третьего удара. Она треснула стекло кулаком в . Во время режима зверя Евы-02 глаза Аски и Мари светились зелёным, а во время режима 777 Евы-02 у Аски не только светится повязка на глаз, но и у самой Аски начинают расти «клыки». Её задние коренные зубы удлиняются и заостряются, по-видимому, в ответ на изменение собственных зубов Евы. Клыки, по-видимому, исчезают после того, как Аска вылезает из Евы.

Светящаяся повязка на глаз Аски

Аска разбивает стекло в комнате для допросов

Отрастающие клыки внутри Евы-02′

Добавить фото в галерею

Неясно, к чему относится проклятие Евы. Это может быть связано с воздействием 9-го Ангела. После спасения Аски от Ангела в 2.0 Рицуко заявила: «Мы не можем исключить возможность психологического загрязнения от Ангела». Некоторые предположили, что это проклятие также может быть связано с длительным воздействием LCL, или Евы, или из-за очень большой глубины капсулы, которую она достигла, когда Ангел заразил Еву-03.

Повязка

Аска теперь носит повязку на левом глазу. Неизвестно точно, что не так с глазом, но что-то под патчем (возможно, всё ещё неповрежденный глаз) светится синим через ткань в двух моментах фильма: после побега Синдзи с Wunder и после того, как Аска активирует режим «777» зверя Евы-02. Кроме того, на глазной повязке, по-видимому, ангелозапечатывающие гексоглифы.

Представление ASCII в ЭВМ

На подавляющем большинстве современных компьютеров, минимально адресуемая единица памяти — байт (размером в 8 бит); поэтому там используются 8-битные, а не 7-битные символы. Обычно символ ASCII расширяют до 8 бит, просто добавляя один нулевой бит в качестве старшего.

На компьютерах IBM/360 однако (в случае использования ASCII) применялся другой метод: 6-й бит (если первым считать самый младший бит) перемещается в 7-й, а бывший 7-й «раздваивается» и копируется и в 8-й бит, и в 6-й. Получается такая таблица:

  .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
NUL SOM EOA EOM EQT WRU RU BELL BKSP HT LF VT FF CR SO SI
1. DC DC1 DC2 DC3 DC4 ERR SYNC LEM S S1 S2 S3 S4 S5 S6 S7
2.                                
3.                                
4. BLANK ! « # $ % & ( ) * + , .
5. 1 2 3 4 5 6 7 8 9 ; < = > ?
6.                                
7.                                
8.                                
9.                                
A. @ A B C D E F G H I J K L M N O
B. P Q R S T U V W X Y Z \
C.                                
D.                                
E.   a b c d e f g h i j k l m n o
F. p q r s t u v w x y z       ESC DEL

На компьютерах с минимально адресуемой единицей памяти в 36 бит — поначалу использовали 6-битные символы (1 слово = 6 символов). После перехода на ASCII на таких компьютерах в одном слове стали размещать либо 5 семибитовых символов (1 бит оставался лишним), либо 4 девятибитовых символа.

Коды ASCII используются в программировании как промежуточные кроссплатформенные коды нажатых клавиш (в противовес скан-кодам IBM PC и прочим внутренним кодам). Для раскладки клавиатуры QWERTY — таблица кодов выглядит так, как показано в следующей таблице.

Escape

27

F1

112

F2

113

F3

114

F4

115

F5

116

F6

117

F7

118

F8

119

F9

120

F10

121

F11

122

F12

123

Print Screen

Scroll Lock

145

Pause

19

`

192

1

49

2

50

3

51

4

52

5

53

6

54

7

55

8

56

9

57

48

189

=+

187

Back Space

8

Insert

45

Home

36

Page Up

33

Num Lock

144

/ доп.

111

* доп.

106

+ доп.

107

Tab

9

Q

81

W

87

E

69

R

82

T

84

Y

89

U

85

I

73

O

79

P

80

219

221

Delete

46

End

35

Page Down

34

7 доп.

103

8 доп.

104

9 доп.

105

Caps Lock

20

A

65

S

83

D

68

F

70

G

71

H

72

J

74

K

75

L

76

186

222

Enter

13

4 доп.

100

5 доп.

101

6 доп.

102

Enter доп.

13

Shift

16

Z

90

X

88

C

67

V

86

B

66

N

78

M

77

,<

188

.>

190

191

Shift

16

\|

220

Up

38

1 доп.

97

2 доп.

98

3 доп.

99

Ctrl

17

super

Alt

18

Space Bar

32

Alt

18

super

list

Ctrl

17

Left

37

Down

40

Right

39

Ins/0 доп.

45/96

Del/. доп.

46/110

Решение[править]

#include <assert.h>
#include <stdio.h>

int main ()
{
  int c;
  while ((c = getchar ()) != EOF) {
    printf (" %3d%s", c, (c == '\n' ? "\n"  ""));
  }
  assert (! ferror (stdin));

  return ;
}

Главный цикл этой программы напоминает таковой для рассмотренной в разделе Максимум; в частности, мы вновь используем цикл «пока» (). Однако, вместо для чтения чисел, здесь мы обращаемся к функции для чтения отдельных знаков (кодов.) Мы по-прежнему используем — для вывода кода символа в десятичной записи.

С другой стороны, из условия корректности ввода исключается требование возврата именно (как признака исчерпания входного потока), поскольку это условие уже является условием завершения главного цикла. Это различие связано с тем, что в данной программе не требуется опозновать «подходящий» ввод — допустимой является совершенно любая последовательность символов (кодов.) Напротив, мы принимали исключительно целые числа в десятичной записи.

Требование ложности значения функции признака ошибки для стандартного ввода () по завершению главного цикла остается в силе.

Подчеркнем, что диапазон возвращаемых функцией значений — это диапазон «символьного» типа плюс одно значение, а именно — признак конца потока . Как следствие, иногда встречаемое в примерах кода чтение символа из потока непосредственно в переменную типа не вполне корректно — для этих целей следует всегда использовать переменную типа .

Обратите внимание, что сформировать условие «конец потока» при вводе с клавиатуры можно вводом (в зависимости от системы и предполагая настройки по-умолчанию) Control-d или Control-z (также обозначаются C-d, ^D, C-z, ^Z.)

Печатные символы ASCII¶

ASCII символ HTML Entity Code Описание
  &#32; пробел
! &#33; восклицательный знак
« &#34; кавычка
# &#35; знак номера
$ &#36; знак доллара
% &#37; знак процента
& &#38; амперсанд
&#39; апостроф
( &#40; левая скобка
) &#41; правая скобка
* &#42; звездочка
+ &#43; знак плюс
, &#44; запятая
&#45; тире
. &#46; точка
&#47; слеш/косая черта
&#48; цифра 0
1 &#49; цифра 1
2 &#50; цифра 2
3 &#51; цифра 3
4 &#52; цифра 4
5 &#53; цифра 5
6 &#54; цифра 6
7 &#55; цифра 7
8 &#56; цифра 8
9 &#57; цифра 9
&#58; двоеточие
; &#59; точка с запятой
< &#60; меньше
= &#61; равно
> &#62; больше
? &#63; вопросительный знак
@ &#64; собачка
A &#65; заглавная A
B &#66; заглавная B
C &#67; заглавная C
D &#68; заглавная D
E &#69; заглавная E
F &#70; заглавная F
G &#71; заглавная G
H &#72; заглавная H
I &#73; заглавная I
J &#74; заглавная J
K &#75; заглавная K
L &#76; заглавная L
M &#77; заглавная M
N &#78; заглавная N
O &#79; заглавная O
P &#80; заглавная P
Q &#81; заглавная Q
R &#82; заглавная R
S &#83; заглавная S
T &#84; заглавная T
U &#85; заглавная U
V &#86; заглавная V
W &#87; заглавная W
X &#88; заглавная X
Y &#89; заглавная Y
Z &#90; заглавная Z
&#91; левая квадратная скобка
\ &#92; обратная косая черта
&#93; правая квадратная скобка
^ &#94; каретка
_ &#95; подчеркивание
` &#96; гравис
a &#97; строчная a
b &#98; строчная b
c &#99; строчная c
d &#100; строчная d
e &#101; строчная e
f &#102; строчная f
g &#103; строчная g
h &#104; строчная h
i &#105; строчная i
j &#106; строчная j
k &#107; строчная k
l &#108; строчная l
m &#109; строчная m
n &#110; строчная n
o &#111; строчная o
p &#112; строчная p
q &#113; строчная q
r &#114; строчная r
s &#115; строчная s
t &#116; строчная t
u &#117; строчная u
v &#118; строчная v
w &#119; строчная w
x &#120; строчная x
y &#121; строчная y
z &#122; строчная z
{ &#123; левая фигурная скобка
| &#124; вертикальная черта
} &#125; правая фигурная скобка
~ &#126; тильда

Таблица кодов управляющих символов ASCII

ASCII Character HTML Entity Code Description
NUL &#00; нуль
SOH &#01; начало заголовка
STX &#02; начало текста
ETX &#03; конец текста
EOT &#04; конец передачи
ENQ &#05; запрос
ACK &#06; подтверждение
BEL &#07; сигнал (звонок)
BS &#08; забой (шаг назад)
HT &#09; горизонтальная табуляция
LF &#10; перевод строки
VT &#11; вертикальная табуляция
FF &#12; новая страница
CR &#13; возврат каретки
SO &#14; включить сдвиг
SI &#15; выключить сдвиг
DLE &#16; ключ связи данных
DC1 &#17; управление устройством 1
DC2 &#18; управление устройством 2
DC3 &#19; управление устройством 3
DC4 &#20; управление устройством 4
NAK &#21; отрицательное подтверждение
SYN &#22; синхронизация
ETB &#23; конец передаваемого блока
CAN &#24; отказ
EM &#25; конец среды
SUB &#26; замена
ESC &#27; ключ
FS &#28; разделитель файлов
GS &#29; разделитель группы
RS &#30; разделитель записей
US &#31; разделитель модулей
DEL &#127; удаление (rubout)

Переход к Unicode

Развитие интернета, увеличение количества компьютеров и удешевление памяти привели к тому, что проблемы, которые доставляла путаница в кодировках, стали перевешивать некоторую экономию памяти. Особенно ярко это проявлялось в интернете, когда текст написанный на одном компьютере должен был корректно отображаться на многих других устройствах. Это доставляло огромные проблемы как программистам, которые должны были решать какую кодировку использовать, так и конечным пользователям, которые не могли получить доступ к интересующим их текстам.

В результате в октябре 1991 года появилась первая версия одной общей таблицы символов, названной Unicode. Она включала в себя на тот момент 7161 различный символ из 24 письменностей мира.

В Unicode постепенно добавлялись новые языки и символы. Например, в версию 1.0.1 в середине 1992 года добавили более 20 000 идеограмм китайского, японского и корейского языков. В актуальной на текущий момент версии содержится уже более 143 000 символов.

ASCII таблица кодов символов Windows (Win-1251)

Dec Hex Символ   Dec Hex Символ
000 00 спец. NOP   128 80 Ђ
001 01 спец. SOH   129 81 Ѓ
002 02 спец. STX   130 82
003 03 спец. ETX   131 83 ѓ
004 04 спец. EOT   132 84
005 05 спец. ENQ   133 85
006 06 спец. ACK   134 86
007 07 спец. BEL   135 87
008 08 спец. BS   136 88
009 09 спец. TAB   137 89
010 0A спец. LF   138 8A Љ
011 0B спец. VT   139 8B ‹ ‹
012 0C спец. FF   140 8C Њ
013 0D спец. CR   141 8D Ќ
014 0E спец. SO   142 8E Ћ
015 0F спец. SI   143 8F Џ
016 10 спец. DLE   144 90 ђ
017 11 спец. DC1   145 91
018 12 спец. DC2   146 92
019 13 спец. DC3   147 93
020 14 спец. DC4   148 94
021 15 спец. NAK   149 95
022 16 спец. SYN   150 96
023 17 спец. ETB   151 97
024 18 спец. CAN   152 98
025 19 спец. EM   153 99
026 1A спец. SUB   154 9A љ
027 1B спец. ESC   155 9B
028 1C спец. FS   156 9C њ
029 1D спец. GS   157 9D ќ
030 1E спец. RS   158 9E ћ
031 1F спец. US   159 9F џ
032 20 сцеп. SP (Пробел)   160 A0
033 21 !   161 A1 Ў
034 22 «   162 A2 ў
035 23 #   163 A3 Ћ
036 24 $   164 A4 ¤
037 25 %   165 A5 Ґ
038 26 &   166 A6 ¦
039 27   167 A7 §
040 28 (   168 A8 Ё
041 29 )   169 A9
042 2A *   170 AA Є
043 2B +   171 AB
044 2C ,   172 AC ¬
045 2D   173 AD ­
046 2E .   174 AE
047 2F   175 AF Ї
048 30   176 B0 °
049 31 1   177 B1 ±
050 32 2   178 B2 І
051 33 3   179 B3 і
052 34 4   180 B4 ґ
053 35 5   181 B5 µ
054 36 6   182 B6
055 37 7   183 B7 ·
056 38 8   184 B8 ё
057 39 9   185 B9
058 3A   186 BA є
059 3B ;   187 BB
060 3C <   188 BC ј
061 3D =   189 BD Ѕ
062 3E >   190 BE ѕ
063 3F ?   191 BF ї
064 40 @   192 C0 А
065 41 A   193 C1 Б
066 42 B   194 C2 В
067 43 C   195 C3 Г
068 44 D   196 C4 Д
069 45 E   197 C5 Е
070 46 F   198 C6 Ж
071 47 G   199 C7 З
072 48 H   200 C8 И
073 49 I   201 C9 Й
074 4A J   202 CA К
075 4B K   203 CB Л
076 4C L   204 CC М
077 4D M   205 CD Н
078 4E N   206 CE О
079 4F O   207 CF П
080 50 P   208 D0 Р
081 51 Q   209 D1 С
082 52 R   210 D2 Т
083 53 S   211 D3 У
084 54 T   212 D4 Ф
085 55 U   213 D5 Х
086 56 V   214 D6 Ц
087 57 W   215 D7 Ч
088 58 X   216 D8 Ш
089 59 Y   217 D9 Щ
090 5A Z   218 DA Ъ
091 5B   219 DB Ы
092 5C \   220 DC Ь
093 5D   221 DD Э
094 5E ^   222 DE Ю
095 5F _   223 DF Я
096 60 `   224 E0 а
097 61 a   225 E1 б
098 62 b   226 E2 в
099 63 c   227 E3 г
100 64 d   228 E4 д
101 65 e   229 E5 е
102 66 f   230 E6 ж
103 67 g   231 E7 з
104 68 h   232 E8 и
105 69 i   233 E9 й
106 6A j   234 EA к
107 6B k   235 EB л
108 6C l   236 EC м
109 6D m   237 ED н
110 6E n   238 EE о
111 6F o   239 EF п
112 70 p   240 F0 р
113 71 q   241 F1 с
114 72 r   242 F2 т
115 73 s   243 F3 у
116 74 t   244 F4 ф
117 75 u   245 F5 х
118 76 v   246 F6 ц
119 77 w   247 F7 ч
120 78 x   248 F8 ш
121 79 y   249 F9 щ
122 7A z   250 FA ъ
123 7B {   251 FB ы
124 7C |   252 FC ь
125 7D }   253 FD э
126 7E ~   254 FE ю
127 7F Спец. DEL   255 FF я

ASCII таблица кодов символов Windows. Описание специальных (управляющих) символов

   
Следует отметить, что первоначально управляющие символы таблицы ASCII использовались
для обеспечения обмена данными по телетайпу, ввода данных с перфоленты и
для простейшего управления внешними устройствами.
В настоящее время большинство из управляющих символов ASCII таблицы
уже не несут эту нагрузку и могут использоваться для иных целей.

Код Описание
NUL, 00 Null, пустой
SOH, 01 Start Of Heading, начало заголовка
STX, 02 Start of TeXt, начало текста.
ETX, 03 End of TeXt, конец текста
EOT, 04 End of Transmission, конец передачи
ENQ, 05 Enquire. Прошу подтверждения
ACK, 06 Acknowledgement. Подтверждаю
BEL, 07 Bell, звонок
BS, 08 Backspace, возврат на один символ назад
TAB, 09 Tab, горизонтальная табуляция
LF, 0A Line Feed, перевод строки.
Сейчас в большинстве языков программирования обозначается как \n
VT, 0B Vertical Tab, вертикальная табуляция.
FF, 0C Form Feed, прогон страницы, новая страница
CR, 0D Carriage Return, возврат каретки.
Сейчас в большинстве языков программирования обозначается как \r
SO, 0E Shift Out, изменить цвет красящей ленты в печатающем устройстве
SI, 0F Shift In, вернуть цвет красящей ленты в печатающем устройстве обратно
DLE, 10 Data Link Escape, переключение канала на передачу данных
DC1, 11 DC2, 12DC3, 13DC4, 14 Device Control, символы управления устройствами
NAK, 15 Negative Acknowledgment, не подтверждаю.
SYN, 16 Synchronization. Символ синхронизации
ETB, 17 End of Text Block, конец текстового блока
CAN, 18 Cancel, отмена переданного ранее
EM, 19 End of Medium, конец носителя данных
SUB, 1A Substitute, подставить.
Ставится на месте символа, значение которого было потеряно или испорчено при передаче
ESC, 1B Escape Управляющая последовательность
FS, 1C File Separator, разделитель файлов
GS, 1D Group Separator, разделитель групп
RS, 1E Record Separator, разделитель записей
US, 1F Unit Separator, разделитель юнитов
DEL, 7F Delete, стереть последний символ.
 

Кодировки на основе Unicode

Unicode можно себе представить как огромную таблицу символов. В памяти компьютера записываются не сами символы, а номера из таблицы. Записывать их можно разными способами. Именно для этого на основе Unicode разработаны несколько кодировок, которые отличаются способом записи номера символа Unicode в виде набора байт. Они называются UTF — Unicode Transformation Format. Есть кодировки постоянной длины, например, UTF-32, в которой номер любого символа из таблицы Unicode занимает ровно 4 байта. Однако наибольшую популярность получила UTF-8 — кодировка с переменным числом байт. Она позволяет кодировать символы так, что наиболее распространённые символы занимают 1-2 байта, и только редко встречающиеся символы могут использовать по 4 байта. Например, все символы таблицы ASCII занимают ровно по одному байту, поэтому текст, написанный на английском языке с использованием кодировки UTF-8, будет занимать столько же места, как и текст, написанный с использованием таблицы символов ASCII.

На сегодняшний день Unicode является основной кодировкой, которую используют в работе все, кто связан с компьютерами и текстами. Unicode позволяет использовать сотни тысяч различных символов и отображать их одинаково на всех устройствах от мобильных телефонов до компьютеров на космических станциях.

Проблемы ASCII

Поскольку количество элементов даже в расширенной таблице не превышало 256, возможность вмещения в одну кодировку нескольких различных письменностей отсутствовала. В 90-е годы в Рунете появилась проблема «крокозябр», когда тексты, набранные русскими символами ASCII, отображались некорректно.

Проблема заключалась в несоответствии кодов различных вариантов ASCII друг другу. Вспомним, что на позициях 128-255 могли располагаться различные знаки, и при смене одной кириллической кодировки на другую все буквы текста заменялись на другие, имеющие идентичный номер в другой версии кодировки.

Базовая таблица кодировки ASCII

32 пробел 48 0 64 @ 80 P 96 ` 112 p
33 ! 49 1 65 A 81 Q 97 a 113 q
34 50 2 66 B 82 R 98 b 114 r
35 # 51 3 67 C 83 S 99 c 115 s
36 $ 52 4 68 D 84 T 100 d 116 t
37 % 53 5 69 E 85 U 101 e 117 u
38 & 54 6 70 F 86 V 102 f 118 v
39 ‘ 55 7 71 G 87 W 103 g 119 w
40 ( 56 8 72 H 88 X 104 h 120 x
41 ) 57 9 73 I 89 Y 105 i 121 y
42 * 58 : 74 J 90 Z 106 j 122 z
43 + 59 ; 75 K 91 [ 107 k 123 {
44 , 60 < 76 L 92 \ 108 l 124 |
45 — 61 = 77 M 93 ] 109 m 125 }
46 . 62 > 78 N 94 ^ 110 n 126 ~
47 / 63 ? 79 O 95 _ 111 o 127

Символы с номерами от 128 до 255 представляют собой таблицу расширения и варьируются в зависимости от набора скриптов, представленных кодировкой символов. Набор символов таблицы расширения различается в зависимости от выбранной кодовой страницы:

Прием

Косплеер в роли Аски на выставке Marseilles Japan Expo 2011

Аска участвовала в различных опросах лучших аниме-пилотов и женских аниме-персонажей, оказавшись популярной как среди женской, так и среди мужской аудитории. В 1996 году она заняла третье место среди «самых популярных женских персонажей на данный момент» в обзоре Гран-при аниме от Animage mangazine, после Рей Аянами и Хикару Шидо из Magic Knight Rayearth . В 1997 и 1998 годах на Гран-при аниме ей также удалось остаться в десятке лучших женских персонажей; в 1997 году она заняла четвертое место, а в 1998 году — шестое. В ежемесячных опросах популярности Animage Аска также заняла третье место в августе 1996 года и седьмое в июле 1998 года. Ее популярность возросла после выхода второго фильма Rebuild of Evangelion ; в августе и сентябре 2009 года она вышла на первое место и оставалась самым популярным женским персонажем Neon Genesis Evangelion в рейтинге популярности журнала Newtype , а в октябре она заняла десятое место. В опросе Newtype, проведенном в марте 2010 года, она была признана третьим по популярности женским аниме-персонажем 1990-х годов сразу после Рей Аянами и Усаги Цукино из Pretty Guardian Sailor Moon . В 2017 году она заняла 16-е место среди персонажей аниме, с которыми читатели аниме предпочли бы умереть, чем выйти замуж.

Ее строчка «Ты дурак?» стала широко использоваться среди хардкорных фанатов с момента ее первого появления в 8-м эпизоде. Ценив ее за «хорошую дозу комического облегчения» Евангелиону , аниме-критик Пит Харкофф назвал ее «надоедливой соплей». Рафаэль Си из THEM Anime Reviews, который нашел характеристику Neon Genesis Evangelion «немного клише или временами просто раздражающей», презирал Аску за ее высокомерное отношение. Редактор Anime News Network Линзи Ловеридж заняла свое седьмое место среди «худших неудачников» в истории аниме. Критик IGN Рэмси Айслер назвал ее 13-м величайшим персонажем аниме всех времен за реалистичность ее персонажей, сказав: «Она трагический персонаж и полная крушение поезда, но именно это делает ее такой привлекательной, потому что мы просто не можем помогите, но наблюдайте, как разворачивается эта прекрасная катастрофа «. CBR включил ее в число лучших женщин-пилотов аниме, назвав ее «лучшим классическим цундэрэ в аниме сёнэн» и «одним из самых захватывающих персонажей аниме».

По словам критика Джея Телотта, Аска «является первым заслуживающим доверия многонациональным персонажем в истории японской SFTV». Crunchyroll также похвалил ее реализм и оригинальность, а Чарапедия написала: «Описание ее психологии реалистично и без принуждения, в отличие от многих других аниме-персонажей. Ее добрая и детская сторона — настоящая причина обаяния Аски». Бой Аски против евангелионов массового производства в «Конец Евангелиона» был особенно хорошо принят критиками, которые считали, что это был ее решающий момент, поскольку в остальном она остается статичной на протяжении большей части фильма. Также похвалили Тиффани Грант за роль актрисы озвучивания Аски на английском языке. Майк Крэндол из Anime News Network заявил, что Грант был «ее старым пылким я в роли Аски». Терон Мартин написала, что изображение Аски в Evangelion: 2.0 You Can (Not) Advance «отличается от начального», заявив, что она даже более антисоциальна, чем в оригинальном аниме. Мартин также написал, что, несмотря на то, что она кажется «наиболее социально адаптированным пилотом Евы в сериале», Аска из Evangelion 2.0 «не претендует на то, чтобы кому-то понравиться», и что она «кажется, в такой же степени мотивирована тем, что сделает свою будущую карьеру. в Nerv, как и она из-за своей личной гордости ». Эрик Суррелл также прокомментировал роль Аски в Evangelion: 2.0 You Can (Not) Advance, заявив, что «прибытие и внезапное увольнение Аски было шокирующим и депрессивным, особенно учитывая, насколько она была неотъемлемой частью оригинального Evangelion ». Саймон Абрамс из Slant Magazine , рецензирующий Evangelion: 2.0 You Can (Not) Advance , негативно оценил новые отношения Синдзи и Аски, «что прискорбно, потому что эта связь должна иметь возможность расти в свое время».

Описание

Аска поглощается ядром девятого Ангела

Ее внешний вид практически не изменился по сравнению с сериалом (цвет волос теперь каштановый, а не рыжий), но её характер и личность заметно отличаются. Прежде всего, она разговаривает и играет с куклой (в то время как Аска Сорью глубоко ненавидела их), когда была в плохом настроении (в первую ночь у Мисато). Она даже готовит еду, чтобы попытаться произвести впечатление на Синдзи, узнав о планах Рей об ужине вместе с Гэндо и Синдзи

Она не проявляет никакого интереса к Кадзи и ревнует, когда Синдзи обращает внимание на Рей.

Аска завтракает вместе с Хикари, но не становится с ней хорошими друзьями. Она выглядит одинокой, которая играет в свою игровую консоль «Wonderswan», блокируя окружающих, подобно тому, как Синдзи сбегает от мира с помощью SDAT.

Она считает Рей и Синдзи своими соперниками в пилотировании (кроме того, она относится к Рей как к сопернику на любовном фронте, хотя Рей не признаёт этого), но постепенно смягчается. В случае Синдзи Аска позволяет ему называть её по имени (хотя она называет его «глупым Синдзи» вместо «папенькин сыночек»). В случае с Рей (которую Сикинами называет «любимицей командующего») Аска решает быть лётчиком-испытателем для злополучной Евы-03, чтобы Рей смогла провести свой званый обед в попытке сблизить Синдзи и Гэндо.

В конце концов, Аска признаётся Мисато, что ей не нужны друзья и она предпочитает оставаться в одиночестве. Но через взаимодействие с другими она начала понимать, что быть с людьми — это хорошо. После этого, Аска осознаёт, что она улыбается, сидя в капсуле Евангелиона: Модуля-03 во время запуска. девятый Ангел заражает Еву-03 и в конечном счете берёт над ней контроль. Капсула Модуля-03 ломается во рту Евы-01. Аска по-прежнему жива и находится под системой жизнеобеспечения; Рицуко называет её «ценным образцом». Тем не менее, Синдзи крайне возмущён решением Гэндо использовать систему псевдопилота, после чего узнаёт о состоянии Аски от Мисато и временно покидает Nerv.

Аска после таймскипа

Аска возвращается в «Evangelion 3.0: You Can (Not) Redo» в новом костюме и с повязкой на левом глазе, показанной в превью к 3.0 после титров 2.0. По словам Юко Миямуры, теперь Аска представляет из себя профессионального наёмника. Интересно, что в фильме она тематически ассоциируется с кошками: носит как козырёк, так и шлем с ушками, а в режиме зверя Ева-02 перевоплощается в гигантского саблезубого кота. Никто из других пилотов не связан с животными таким образом, поэтому неясно, что этот мотив может означать.

В третьем фильме Аске двадцать восемь, но её тело по-прежнему в возрасте четырнадцати лет (из-за явления, которое она называет «проклятием Евы»). Аска освобождает тессеракт, хранящий Евангелион-01 и служит пилотом Евы-02, на этот раз под управлением Wille. Она сильно обижена на Синдзи за то, что тот инициировал Преддверие Третьего удара. Аска даже сражается с ним и Каору, находящимися в Еве-13. Во время противостояния напавшему на Wunder Mark.09 она вынуждена активировать в Еве систему самоуничтожения, чтобы победить, после чего катапультируется, а её Еву разносит на части взрывом, уничтожившим Mark.09. В конце фильма Аска вытаскивает Синдзи из контактной капсулы и направляется с ним и клоном Рей на поиски людей.

Комментарии

Символы ASCII ограничены самыми низкими 128 символами Юникода от U + 0000 до U + 007F.ASCII characters are limited to the lowest 128 Unicode characters, from U+0000 to U+007F.

При выборе кодировки ASCII для приложения учитывайте следующее.When selecting the ASCII encoding for your app, consider the following:

Кодировка ASCII обычно подходит для протоколов, требующих ASCII.The ASCII encoding is usually appropriate for protocols that require ASCII.

Если требуется 8-разрядная кодировка (которая иногда ошибочно называется ASCII), рекомендуется использовать кодировку UTF-8 в кодировке ASCII.If you requires 8-bit encoding (which is sometimes incorrectly referred to as «ASCII»), the UTF-8 encoding is recommended over the ASCII encoding. Для символов 0-7F результаты идентичны, но использование UTF-8 позволяет избежать потери данных, разрешая представление всех символов Юникода, которые можно представить.For the characters 0-7F, the results are identical, but use of UTF-8 avoids data loss by allowing representation of all Unicode characters that are representable

Обратите внимание, что кодировка ASCII имеет 8-разрядную неоднозначность, которая может допускать вредоносное использование, но кодировка UTF-8 устраняет неоднозначность в восьмом бите.Note that the ASCII encoding has an 8th bit ambiguity that can allow malicious use, but the UTF-8 encoding removes ambiguity about the 8th bit.

До .NET Framework версии 2,0 .NET Framework допускает подмену, игнорируя восьмой бит.Prior to .NET Framework version 2.0, .NET Framework allowed spoofing by ignoring the 8th bit. Начиная с .NET Framework 2,0, в процессе декодирования кодовые точки, не входящие в набор ASCII, переходят назад.Beginning with .NET Framework 2.0, non-ASCII code points fall back during decoding.

ASCIIEncodingОбъект, возвращаемый этим свойством, может не иметь соответствующего поведения для приложения.The ASCIIEncoding object that is returned by this property might not have the appropriate behavior for your app. Он использует резервный вариант замены, чтобы заменить каждую строку, которую не удается закодировать, и каждый байт, который не может быть декодирован символом вопросительного знака («?»).It uses replacement fallback to replace each string that it cannot encode and each byte that it cannot decode with a question mark («?») character. Вместо этого можно вызвать метод для создания экземпляра ASCIIEncoding объекта, резерв которого является либо EncoderFallbackException или DecoderFallbackException , как показано в следующем примере.Instead, you can call the method to instantiate an ASCIIEncoding object whose fallback is either an EncoderFallbackException or a DecoderFallbackException, as the following example illustrates.

ASCII символы. Другие символы

NUL

Null. (No character — нет данных). Используется для передачи в случае отсутствия данных.

BEL

Bell (Звонок). Используется для управления устройствами сигнализации.

SO

Shift Out. Указывает, что все последующие кодовые комбинации должны интерпретироваться согласно внешнему набору символов до прихода символа SI.

SI

Shift In. Указывает, что последующие кодовые комбинации должны интерпретироваться согласно стандартному набору символов.

DLE

Data Link Escape (Переключение). Изменение значения идущих следом символов. Используется для дополнительного контроля или для передачи произвольной комбинации бит.

DC1, DC2, DC3, DC4

Device Controls (Контроль Устройства). Символы для управления вспомогательными устройствами (специальными функциями).

CAN

Cancel (Отмена). Указывает, что данные, который предшествовали этому символу в сообщении или блоке, должны игнорироваться (обычно в случае обнаружения ошибки).

EM

End of Medium (Конец Носителя). Указывает на физический конец ленты или другого носителя информации

SUB

Substitute (Заместитель). Используется для подмены ошибочного или недопустимого символа.

ESC

Escape (Расширение). Используется для расширения кода, указывая на то, что последующий символ имеет альтернативное значение.

(sp)

Space (Пробел). Непечатаемый символ для разделения слов или перемещения механизма печати или курсора дисплея вперед на одну позицию.

DEL

Delete (Удаление). Используется для удаления (стирания) предыдущего знака в сообщении

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector