ИСО / МЭК 8859-6 - ISO/IEC 8859-6
MIME / IANA | ISO-8859-6 |
---|---|
Псевдоним (а) | iso-ir-127, ECMA-114, ASMO-708, арабский, csISOLatinArabic |
Стандарт | ASMO 708, ECMA-114, ISO / IEC 8859-6 |
Классификация | расширенный ASCII , ISO 8859 |
Расширения | OEM-708 , Mac OS арабский (почти) |
Предшествует | ASMO 449 |
Другая связанная кодировка (и) | Windows-1256 (несовместимо, перемещает несколько букв) |
ISO / IEC 8859-6: 1999 , Информационные технологии - 8-битные однобайтовые наборы графических символов - Часть 6: Латинский / арабский алфавит , является частью серии стандартных кодировок символов на основе ASCII ISO / IEC 8859 , первое издание опубликовано в 1987 году. Неофициально он называется латинским / арабским . Он был разработан для арабского языка . Кодируются только номинальные буквы, предварительная форма букв отсутствует, поэтому для отображения требуется обработка формования. Он не включает дополнительные буквы, необходимые для написания большинства языков с арабской графикой, кроме самого арабского (таких как персидский, урду и т. Д.).
ISO-8859-6 является предпочтительным названием кодировки IANA для этого стандарта, если он дополнен управляющими кодами C0 и C1 из ISO / IEC 6429 . Текст находится в логическом порядке, поэтому для отображения требуется обработка BiDi . Номинально ISO-8859-6 ( кодовая страница 28596 ) предназначен для «визуального порядка», а ISO-8859-6-I ( кодовая страница 38596 ) - для логического порядка. Но на практике и требуется для документов HTML и XML, ISO-8859-6 также обозначает текст в логическом порядке. Существует также ISO-8859-6-E, который предположительно требует, чтобы направленность была явно указана с помощью специальных управляющих символов; этот последний вариант на практике не используется. IBM присвоила кодовую страницу / CCSID 1089 стандарту ISO 8859-6. Это эмуляция их операционной системы AIX .
ISO-8859-6 сейчас технологически устарел , и Unicode предпочтительнее в современных приложениях, особенно в Интернете; что означает доминирующую кодировку UTF-8 для веб-страниц (см. также арабский шрифт в Unicode , для полного охвата, в отличие, например, от ISO-8859-6 или Windows 1256, которые не охватывают дополнительные функции). 0,1% всех веб-страниц используют ISO-8859-6.
История
ASMO 708 был разработан ныне несуществующей Арабской организацией по стандартизации и метрологии в 1986 году как 8-битный стандарт для использования в арабоязычных странах. Дизайн этого набора символов был вдохновлен предыдущим 7-битным стандартом - ASMO 449 - но это не просто 7-битный набор символов, перемещенный в верхнюю часть; есть некоторые отличия.
ASMO 708 - это двунаправленный набор символов. Нижняя часть набора символов отличается от стандарта ISO 646 цифрами и некоторыми пунктуацией. В зависимости от контекста (находятся ли числа в латинском или арабском шрифте) цифры отображаются либо как латинские, либо как арабские цифры. Кроме того, в зависимости от контекста симметричные знаки препинания меняются местами, то есть всякий раз, когда есть открывающий знак пунктуации, форма отображается по-разному в соответствии с направлением сценария.
В верхней части набора символов есть только арабские буквы, арабская пунктуация, отличная от латинской, а также несколько других символов.
ASMO 708 был разработан в тесном сотрудничестве с ECMA , которая приняла его в качестве собственного стандарта ECMA-114 в 1986 году. Он также был утвержден в качестве стандарта ISO как ISO 8859-6 . Он также был зарегистрирован в Международном регистре наборов кодированных символов как IR 127 в 1986 году.
Связь с другими наборами символов
Некоторые другие наборы символов относятся к ASMO 708:
- ASMO 708 / French 1 добавляет французские строчные буквы;
- Французский 1 / ASMO 708 добавляет французские строчные буквы в их кодовые точки ISO 8859-1 и перемещает арабские символы ;
- ISO / IR 167 добавляет французские и немецкие символы;
- Кодовая страница 708 Microsoft для MS-DOS добавляет французские символы в их типичные кодовые точки из кодовой страницы 437 и добавляет символы рисования прямоугольников;
- И кодовая страница Microsoft 710 (прозрачный арабский), и кодовая страница Microsoft 720 (прозрачный ASMO) для MS-DOS добавляют французские символы в их типичные кодовые точки из кодовой страницы 437, но смещают арабские символы, чтобы можно было рисовать символы из кода. страница 437 должна быть в исходном коде;
- Microsoft Windows 1256 добавляет французские символы нижнего регистра в свои кодовые точки Windows 1252 и перемещает арабские символы ;
Таблица кодов
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
||||||||||||||||
1_ 16 |
||||||||||||||||
2_ 32 |
SP 0020 |
! 0021 |
« 0022 |
# 0023 |
0024 долл. США |
% / ٪ 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* / ٭ 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0/٠ 0030 |
1/ 0031 |
2 февраля 0032 |
3/٣ 0033 |
4 января 0034 |
5 мая 0035 |
6 июня 0036 |
7 августа 0037 |
8 августа 0038 |
9 сентября 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
I 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
№ 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
Т 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
а 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
г 0067 |
h 0068 |
я 0069 |
j 006A |
k 006B |
l 006C |
м 006D |
№ 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
с 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
х 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
|
8_ 128 |
||||||||||||||||
9_ 144 |
||||||||||||||||
A_ 160 |
NBSP 00A0 |
¤ 00A4 |
، 060C |
SHY 00AD |
||||||||||||
B_ 176 |
؛ 061B |
؟ 061F |
||||||||||||||
C_ 192 |
ء 0621 |
آ 0622 |
أ 0623 |
ؤ 0624 |
إ 0625 |
ئ 0626 |
ا 0627 |
ب 0628 |
ة 0629 |
ت 062A |
ث 062B |
ج 062C |
ح 062D |
خ 062E |
د 062F |
|
D_ 208 |
ذ 06:30 |
ر 0631 |
ز 0632 |
س 0633 |
ش 0634 |
ص 0635 |
ض 0636 |
ط 0637 |
ظ 0638 |
ع 0639 |
غ 063A |
|||||
E_ 224 |
0640 |
ف 0641 |
ق 0642 |
ك 0643 |
ل 0644 |
م 0645 |
ن 0646 |
ه 0647 |
و 0648 |
ى 0649 |
ي 064A |
◌ً 064B |
◌ٌ 064C |
◌ٍ 064D |
◌َ 064E |
◌ُ 064F |
F_ 240 |
◌ِ 0650 |
◌ّ 0651 |
◌ْ 0652 |
Письмо Число Пунктуация Символ Другой Неопределенный
Кодовые значения 0xEB – 0xF2 назначаются для комбинирования символов .
Смотрите также
- ASMO 449
- ISO 8859
- Windows-1256 (арабская кодовая страница Windows)
Рекомендации
Внешние ссылки
- ИСО / МЭК 8859-6: 1999
- Стандартный ECMA-114 : 8-битные однобайтовые графические наборы символов - латинский / арабский алфавит, 2-е издание (декабрь 2000 г.)
- ISO-IR 127 Правая часть латинского / арабского алфавита (30 ноября 1986 г.)