ИСО / МЭК 8859-6 - ISO/IEC 8859-6

ISO-8859-6 (ASMO 708)
MIME / IANA ISO-8859-6
Псевдоним (а) iso-ir-127, ECMA-114, ASMO-708, арабский, csISOLatinArabic
Стандарт ASMO 708, ECMA-114, ISO / IEC 8859-6
Классификация расширенный ASCII , ISO 8859
Расширения OEM-708 , Mac OS арабский (почти)
Предшествует ASMO 449
Другая связанная кодировка (и) Windows-1256 (несовместимо, перемещает несколько букв)

ISO / IEC 8859-6: 1999 , Информационные технологии - 8-битные однобайтовые наборы графических символов - Часть 6: Латинский / арабский алфавит , является частью серии стандартных кодировок символов на основе ASCII ISO / IEC 8859 , первое издание опубликовано в 1987 году. Неофициально он называется латинским / арабским . Он был разработан для арабского языка . Кодируются только номинальные буквы, предварительная форма букв отсутствует, поэтому для отображения требуется обработка формования. Он не включает дополнительные буквы, необходимые для написания большинства языков с арабской графикой, кроме самого арабского (таких как персидский, урду и т. Д.).

ISO-8859-6 является предпочтительным названием кодировки IANA для этого стандарта, если он дополнен управляющими кодами C0 и C1 из ISO / IEC 6429 . Текст находится в логическом порядке, поэтому для отображения требуется обработка BiDi . Номинально ISO-8859-6 ( кодовая страница 28596 ) предназначен для «визуального порядка», а ISO-8859-6-I ( кодовая страница 38596 ) - для логического порядка. Но на практике и требуется для документов HTML и XML, ISO-8859-6 также обозначает текст в логическом порядке. Существует также ISO-8859-6-E, который предположительно требует, чтобы направленность была явно указана с помощью специальных управляющих символов; этот последний вариант на практике не используется. IBM присвоила кодовую страницу / CCSID 1089 стандарту ISO 8859-6. Это эмуляция их операционной системы AIX .

ISO-8859-6 сейчас технологически устарел , и Unicode предпочтительнее в современных приложениях, особенно в Интернете; что означает доминирующую кодировку UTF-8 для веб-страниц (см. также арабский шрифт в Unicode , для полного охвата, в отличие, например, от ISO-8859-6 или Windows 1256, которые не охватывают дополнительные функции). 0,1% всех веб-страниц используют ISO-8859-6.

История

ASMO 708 был разработан ныне несуществующей Арабской организацией по стандартизации и метрологии в 1986 году как 8-битный стандарт для использования в арабоязычных странах. Дизайн этого набора символов был вдохновлен предыдущим 7-битным стандартом - ASMO 449 - но это не просто 7-битный набор символов, перемещенный в верхнюю часть; есть некоторые отличия.

ASMO 708 - это двунаправленный набор символов. Нижняя часть набора символов отличается от стандарта ISO 646 цифрами и некоторыми пунктуацией. В зависимости от контекста (находятся ли числа в латинском или арабском шрифте) цифры отображаются либо как латинские, либо как арабские цифры. Кроме того, в зависимости от контекста симметричные знаки препинания меняются местами, то есть всякий раз, когда есть открывающий знак пунктуации, форма отображается по-разному в соответствии с направлением сценария.

В верхней части набора символов есть только арабские буквы, арабская пунктуация, отличная от латинской, а также несколько других символов.

ASMO 708 был разработан в тесном сотрудничестве с ECMA , которая приняла его в качестве собственного стандарта ECMA-114 в 1986 году. Он также был утвержден в качестве стандарта ISO как ISO 8859-6 . Он также был зарегистрирован в Международном регистре наборов кодированных символов как IR 127 в 1986 году.

Связь с другими наборами символов

Некоторые другие наборы символов относятся к ASMO 708:

  • ASMO 708 / French 1 добавляет французские строчные буквы;
  • Французский 1 / ASMO 708 добавляет французские строчные буквы в их кодовые точки ISO 8859-1 и перемещает арабские символы ;
  • ISO / IR 167 добавляет французские и немецкие символы;
  • Кодовая страница 708 Microsoft для MS-DOS добавляет французские символы в их типичные кодовые точки из кодовой страницы 437 и добавляет символы рисования прямоугольников;
  • И кодовая страница Microsoft 710 (прозрачный арабский), и кодовая страница Microsoft 720 (прозрачный ASMO) для MS-DOS добавляют французские символы в их типичные кодовые точки из кодовой страницы 437, но смещают арабские символы, чтобы можно было рисовать символы из кода. страница 437 должна быть в исходном коде;
  • Microsoft Windows 1256 добавляет французские символы нижнего регистра в свои кодовые точки Windows 1252 и перемещает арабские символы ;

Таблица кодов

ИСО / МЭК 8859-6
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
0_
0
1_
16
2_
32
SP
0020
!
0021
«
0022
#
0023
0024 долл. США
% / ٪
0025
&
0026
'
0027
(
0028
)
0029
* / ٭
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0/٠
0030
1/
0031
2
февраля 0032
3/٣
0033
4 января
0034
5
мая 0035
6 июня
0036
7
августа 0037
8 августа
0038
9 сентября
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
I
0049
J
004A
K
004B
L
004C
M
004D

004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
b
0062
c
0063
d
0064
e
0065
f
0066
г
0067
h
0068
я
0069
j
006A
k
006B
l
006C
м
006D

006E
o
006F
7_
112
p
0070
q
0071
r
0072
с
0073
t
0074
u
0075
v
0076
w
0077
х
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
8_
128
9_
144
A_
160
NBSP
00A0
¤
00A4
،
060C
SHY
00AD
B_
176
؛
061B
؟
061F
C_
192
ء
0621
آ
0622
أ
0623
ؤ
0624
إ
0625
ئ
0626
ا
0627
ب
0628
ة
0629
ت
062A
ث
062B
ج
062C
ح
062D
خ
062E
د
062F
D_
208
ذ
06:30
ر
0631
ز
0632
س
0633
ش
0634
ص
0635
ض
0636
ط
0637
ظ
0638
ع
0639
غ
063A
E_
224
0640
ف
0641
ق
0642
ك
0643
ل
0644
م
0645
ن
0646
ه
0647
و
0648
ى
0649
ي
064A
◌ً
064B
◌ٌ
064C
◌ٍ
064D
◌َ
064E
◌ُ
064F
F_
240
◌ِ
0650
◌ّ
0651
◌ْ
0652

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Кодовые значения 0xEB – 0xF2 назначаются для комбинирования символов .

Смотрите также

Рекомендации

Внешние ссылки

  • ИСО / МЭК 8859-6: 1999
  • Стандартный ECMA-114 : 8-битные однобайтовые графические наборы символов - латинский / арабский алфавит, 2-е издание (декабрь 2000 г.)
  • ISO-IR 127 Правая часть латинского / арабского алфавита (30 ноября 1986 г.)