ИСО / МЭК 8859 - ISO/IEC 8859

Семейство кодировок ISO 8859
Стандарт ISO / IEC 8859
Классификация 8-битный расширенный ASCII , ISO 4873 уровень 1
Расширяется US-ASCII
Предшествует ISO 646
Преемник ISO / IEC 10646 ( Юникод )
Другая связанная кодировка (и) ISO / IEC 10367 , Windows-125x

ISO / IEC 8859 - это совместная серия стандартов ISO и IEC для 8-битных кодировок символов . Серия стандартов состоит из пронумерованных частей, таких как ISO / IEC 8859-1 , ISO / IEC 8859-2 и т. Д. Всего 15 частей, не считая заброшенного ISO / IEC 8859-12 . Рабочая группа ISO, поддерживающая эту серию стандартов, была распущена.

Части 1, 2, 3 и 4 ISO / IEC 8859 изначально были международным стандартом Ecma ECMA-94 .

Вступление

Хотя битовых комбинаций 95 печатных символов ASCII достаточно для обмена информацией на современном английском языке , для большинства других языков, использующих латинские алфавиты, требуются дополнительные символы, не охватываемые ASCII. ISO / IEC 8859 попытался решить эту проблему, используя восьмой бит в 8-битном байте, чтобы разрешить позиции для других 96 печатаемых символов. Раннее кодирование было ограничено 7 битами из-за ограничений некоторых протоколов передачи данных и частично по историческим причинам. Однако требовалось больше символов, чем могло поместиться в одной 8-битной кодировке символов, поэтому было разработано несколько отображений, в том числе как минимум десять, подходящих для различных латинских алфавитов.

Стандартные части ISO / IEC 8859 определяют только печатаемые символы, хотя они явно разделяют диапазоны байтов 0x00–1F и 0x7F – 9F как «комбинации, которые не представляют графические символы» (т. Е. Зарезервированы для использования в качестве управляющих символов ) в соответствии с с ISO / IEC 4873 ; они были разработаны для использования вместе с отдельным стандартом, определяющим функции управления, связанные с этими байтами, например ISO 6429 или ISO 6630 . С этой целью серия кодировок, зарегистрированных в IANA, добавляет контрольный набор C0 (контрольные символы, сопоставленные с байтами от 0 до 31) из ISO 646 и контрольный набор C1 (контрольные символы, сопоставленные с байтами от 128 до 159) из ISO 6429, в результате полные 8-битные символьные карты с большинством, если не всеми, назначенными байтами. Эти наборы имеют ISO-8859- n в качестве предпочтительного имени MIME или, в случаях, когда предпочтительное имя MIME не указано, их каноническое имя. Многие люди используют термины ISO / IEC 8859- n и ISO-8859- n как синонимы. ISO / IEC 8859-11 не получил такой кодировки, предположительно потому, что он был почти идентичен TIS 620 .

Символы

Стандарт ISO / IEC 8859 разработан для надежного обмена информацией, а не для типографики ; в стандарте отсутствуют символы, необходимые для высококачественной типографики, такие как необязательные лигатуры, фигурные кавычки, тире и т. д. В результате в высококачественных системах набора часто используются проприетарные или идиосинкразические расширения поверх стандартов ASCII и ISO / IEC 8859. , или используйте вместо него Unicode .

Неточное правило, основанное на практическом опыте, гласит, что, если символ или символ еще не был частью широко используемого набора символов обработки данных, а также обычно не предоставлялся на клавиатуре пишущих машинок для национального языка, он не попал. двойные кавычки « и », используемые для некоторых европейских языков, были включены, но не направленные двойные кавычки « и », используемые для английского и некоторых других языков.

Французы не получить его œ и Œ лигатуры , потому что они могут быть набраны как «ае». Аналогично, Ÿ , необходимая для текста, состоящего только из заглавных букв, также была удалена. Эти три символа, хотя и под разными кодовыми точками, были позже повторно введены в ISO / IEC 8859-15 в 1999 году, в котором также был введен новый символ знака евро €. Точно так же голландский язык не получил букв ij и IJ , потому что носители голландского языка привыкли печатать их как две буквы.

Румынский язык изначально не получил своих букв Ș / ș и Ț / ț ( с запятой ), потому что эти буквы были первоначально объединены с Ş / ş и Ţ / ţ ( с седилем ) Консорциумом Unicode , считая формы с запятой ниже как глифовые варианты фигур с седилем. Однако буквы с явной запятой ниже были позже добавлены в стандарт Unicode, а также в ISO / IEC 8859-16 .

Большинство кодировок ISO / IEC 8859 содержат диакритические знаки, необходимые для различных европейских языков с использованием латинского алфавита. В других есть нелатинские алфавиты: греческий , кириллица , иврит , арабский и тайский . Большинство кодировок содержат только символы пробела , хотя тайские, еврейские и арабские кодировки также содержат комбинирующие символы .

Стандарт не предусматривает использования шрифтов восточноазиатских языков ( CJK ), поскольку их идеографические системы письма требуют многих тысяч кодовых точек. Хотя в нем используются символы на основе латиницы, вьетнамский язык также не помещается в 96 позиций (без использования комбинированных диакритических знаков, таких как Windows-1258 ). Каждый японский слоговой алфавит (хирагана или катакана, см. Кана ) подойдет, как в JIS X 0201 , но, как и несколько других мировых алфавитов, они не закодированы в системе ISO / IEC 8859.

Части ISO / IEC 8859

ISO / IEC 8859 разделен на следующие части:

Часть Имя Редакции Прочие стандарты Описание
Часть 1 Latin-1
западноевропейская
1987 , 1998 ECMA-94 ( 1985 , 1986) Пожалуй, наиболее широко используемая часть ISO / IEC 8859, охватывающая большинство западноевропейских языков: датский (частично), голландский (частично), английский , фарерский , финский (частично), французский (частично), немецкий , исландский , ирландский , итальянский , Норвежский , португальский , ретороманский , шотландский гэльский , испанский , каталонский и шведский языки . Охватываются также языки из других частей мира, в том числе: восточноевропейский албанский , индонезийский в Юго-Восточной Азии , а также африканские языки африкаанс и суахили .

Модификация DEC MCS ; в первой (1985 г.) стандартной версии на уровне ECMA отсутствовали знак времени и

знак
деления , которые были добавлены в следующем году. Отсутствующий знак евро и заглавная буква Ÿ присутствуют в пересмотренной версии ISO / IEC 8859-15 (см. Ниже). Соответствующий набор символов IANA - ISO-8859-1.
Часть 2 Latin-2
Центральноевропейская
1987 , 1999 ECMA-94 (1986) Поддерживает те языки Центральной и Восточной Европы, которые используют латинский алфавит, включая боснийский , польский , хорватский , чешский , словацкий , словенский , сербский и венгерский . Отсутствующий знак евро можно найти в версии ISO / IEC 8859-16.
Часть 3 Latin-3
Южноевропейский
1988 , 1999 Турецкий , мальтийский и эсперанто . В значительной степени заменен ISO / IEC 8859-9 для турецкого языка.
Часть 4 Latin-4
Северо-Европейский
1988 , 1998 Эстонский , латышский , литовский , гренландский и саамский .
Часть 5. Латиница / кириллица 1988 , 1999 ECMA-113 (1988, 1999) Охватывает в основном славянские языки с кириллицей , включая белорусский , болгарский , македонский , русский , сербский и украинский (частично).
Часть 6 Латинский / арабский 1987 , 1999 ASMO 708 (1986) / ECMA-114 (1986, 2000) Охватывает наиболее распространенные символы арабского языка . Не поддерживает другие языки, использующие арабский шрифт . Должен быть обработан двунаправленным письмом и курсивным соединением для отображения.
Часть 7 Латинский / греческий 1987 , 2003 ЭЛОТ 928 (1986) / ECMA-118 (1986) Охватывает современный греческий язык ( монотонная орфография ). Может также использоваться для древнегреческого письма без акцентов или в монотонной орфографии, но без диакритических знаков для политонической орфографии . Они были введены в Unicode. Обновленный в 2003 , чтобы добавить знак евро , драхмы знак и расстояние между ними ypogegrammeni .
Часть 8 Латинский / иврит 1988 , 1999 ECMA-121 (1987, 2000) / SI 1311 ( 2002 ) Охватывает современный еврейский алфавит, используемый в Израиле. На практике две различных кодировки существуют, логические порядка (должно быть BiDi обработано для отображения) и визуальный (слева направо) порядок (в действительности, после двунаправленной обработки и линии разрыва). Обновлено 1999, чтобы добавить LRM и RLM . Обновлен на уровне национального стандарта в 2002 году, чтобы добавить знаки евро и шекель и больше эффектов двунаправленного формата; дополнения 2002 года никогда не были включены обратно в стандартную версию ISO.
Часть 9 Latin-5
Турецкий
1989 , 1999 ECMA-128 (1988, 1999) Во многом то же, что и ISO / IEC 8859-1, с заменой редко используемых исландских букв турецкими .
Часть 10. Latin-6
Nordic
1992 , 1998 ECMA-144 (1990, 1992, 2000) Перестановка Latin-4. Считается более полезным для скандинавских языков. В балтийских языках больше используется Latin-4.
Часть 11 Латинский / тайский 2001 г. ТИС-620 (1986, 1990) Содержит символы, необходимые для тайского языка . Первая редакция утверждена в 1986 г. на уровне национального стандарта как TIS 620 . Повышен до статуса стандарта ISO как часть ISO 8859 в 2001 году с добавлением неразрывного пробела .
Часть 12 Латинский / деванагари N / A - Работа по созданию части 8859 для Деванагари была официально прекращена в 1997 году. ISCII и Unicode / ISO / IEC 10646 охватывают Деванагари.
Часть 13. Latin-7
Балтийский край
1998 г. - Добавлены некоторые символы для балтийских языков, которых не было в Latin-4 и Latin-6. Относится к ранее опубликованной Windows-1257 .
Часть 14. Latin-8
кельтский
1998 г. - Охватывает кельтские языки, такие как гэльский и бретонский . Валлийские буквы соответствуют более раннему (1994 г.) ISO-IR-182 .
Часть 15. Латиница-9 1999 г. - Пересмотр 8859-1, который удаляет некоторые малоиспользуемые символы, заменяя их знаком евро и буквами Š , š , Ž , ž , Œ , œ и Ÿ , что завершает охват французского , финского и эстонского языков .
Часть 16. Latin-10
Юго-Восточная Европа
2001 г. SR 14111 (1998) Предназначен для албанского , хорватского , венгерского , итальянского , польского , румынского и словенского языков, а также для финского, французского, немецкого и ирландского гэльского (новая орфография). Основное внимание уделяется скорее буквам, чем символам. Знак валюты заменяется знаком евро .

Каждая часть ISO / IEC 8859 предназначена для поддержки языков, которые часто заимствуют друг у друга, поэтому символы, необходимые для каждого языка, обычно размещаются в одной части. Однако есть некоторые символы и языковые комбинации, которые нельзя использовать без транскрипции. Были предприняты усилия, чтобы преобразование было как можно более плавным. Например, в немецком языке все семь специальных символов находятся на одних и тех же позициях во всех латинских вариантах (1–4, 9, 10, 13–16), и во многих позициях символы различаются только диакритическими знаками между наборами. В частности, варианты 1–4 были разработаны совместно и обладают тем свойством, что каждый закодированный символ появляется либо в заданной позиции, либо не появляется вовсе.

Стол

Сравнение различных частей (1–16) ISO / IEC 8859
Двоичный Октябрь Декабрь Шестигранник 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
1010 0000 240 160 A0 Неразрывный пробел (НБСП)
1010 0001 241 161 A1 ¡ Ą ЧАС Ą Ё   '   ¡ Ą ¡ Ą
1010 0010 242 162 A2 ¢ ˘ ĸ Ђ   ' ¢ ¢ Ē ¢ ¢ ą
1010 0011 243 163 A3 £ Ł £ Р Ѓ   £ ГРАММ £ Ł
1010 0100 244 164 A4 ¤ Є ¤ ¤ Я ¤ Ċ
1010 0101 245 165 A5 ¥ Ľ   Я Ѕ   ¥ Я ċ ¥
1010 0110 246 166 A6 ¦ Ś ЧАС Ļ І   ¦ Ķ ¦ Š
1010 0111 247 167 A7 § Ї   § §
1010 1000 250 168 A8 ¨ Ј   ¨ Ļ Ø š
1010 1001 251 169 A9 © Š Я Š Љ   © Đ ©
1010 1010 252 170 AA ª Ş Ē Њ   ͺ × ª Š Р ª Ș
1010 1011 253 171 AB « Ť ГРАММ ГРАММ Ћ   « Ŧ « «
1010 1100 254 172 AC ¬ Ź Ĵ Ŧ Ќ ، ¬ Ž ¬ ¬ Ź
1010 1101 255 173 ОБЪЯВЛЕНИЕ Мягкий дефис (SHY) ЗАСТЕНЧИВЫЙ
1010 1110 256 174 AE ® Ž   Ž Ў     ® Ū ® ź
1010 1111 257 175 AF ¯ Ż ¯ Џ   - ¯ Ŋ Æ Ÿ ¯ Ż
1011 0000 260 176 B0 ° А   ° ° °
1011 0001 261 177 B1 ± ą час ą Б   ± ą ± ±
1011 0010 262 178 Би 2 ² ˛ ² ˛ В   ² ē ² ГРАММ ² Č
1011 0011 263 179 B3 ³ ł ³ р Г   ³ грамм ³ грамм ³ ł
1011 0100 264 180 B4 ´ Д   ΄ ´ я « Ž
1011 0101 265 181 B5 µ ľ µ я Е   ΅ µ я µ µ
1011 0110 266 182 B6 ś час ļ Ж   Ά ķ
1011 0111 267 183 B7 · ˇ · ˇ З   · · П ·
1011 1000 270 184 B8 ¸ И   Έ ¸ ļ ø ž
1011 1001 271 185 B9 ¹ š я š Й   Ή ¹ đ ¹ п ¹ č
1011 1010 272 186 BA º ş ē К   Ί ÷ º š р º ș
1011 1011 273 187 BB » ť грамм грамм Л ؛ » ŧ » »
1011 1100 274 188 до н.э ¼ ź ĵ ŧ М   Ό ¼ ž ¼ Œ
1011 1101 275 189 BD ½ ˝ ½ Ŋ Н   ½ - ½ œ
1011 1110 276 190 БЫТЬ ¾ ž   ž О   Ύ ¾ ū ¾ Ÿ
1011 1111 277 191 BF ¿ ż ŋ П ؟ Ώ   ¿ ŋ æ ¿ ż
1100 0000 300 192 C0 А Р А Ā Р   ΐ   А Ā Ą А
1100 0001 301 193 C1 Á С ء Α   Á Я Á
1100 0010 302 194 C2 Â Т آ Β   Â Ā Â
1100 0011 303 195 C3 Ã Ă   Ã У أ Γ   Ã Ć Ã Ă
1100 0100 304 196 C4 Ä Ф ؤ Δ   Ä Ä
1100 0101 305 197 C5 Å Ĺ Ċ Å Х إ Ε   Å Å Ć
1100 0110 306 198 C6 Æ Ć Ĉ Æ Ц ئ Ζ   Æ Ę Æ
1100 0111 307 199 C7 Ç Я Ч ا Η   Ç Я Ē Ç
1100 1000 310 200 C8 È Č È Č Ш ب Θ   È Č Č È
1100 1001 311 201 C9 É Щ ة Ι   É É
1100 1010 312 202 CA Ê Ę Ê Ę Ъ ت Κ   Ê Ę Ź Ê
1100 1011 313 203 CB Ë Ы ث Λ   Ë Ė Ë
1100 1100 314 204 CC Я Ě Я Ė Ь ج Μ   Я Ė ГРАММ Я
1100 1101 315 205 CD Я Э ح Ν   Я Ķ Я
1100 1110 316 206 CE Я Ю خ Ξ   Я Я Я
1100 1111 317 207 CF Я Ď Я Я Я د Ο   Я Ļ Я
Двоичный Октябрь Декабрь Шестигранник 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
1101 0000 320 208 D0 Ð Đ   Đ а ذ Π   ГРАММ Ð Š Ŵ Ð
1101 0001 321 209 D1 Ñ Ń Ñ Ņ б ر Ρ   Ñ Ņ Ń Ñ Ń
1101 0010 322 210 D2 Ò Ň Ò Ō в ز     Ò Ō Ņ Ò
1101 0011 323 211 D3 Ó Ķ г س Σ   Ó Ó
1101 0100 324 212 D4 Ô д ش Τ   Ô Ō Ô
1101 0101 325 213 D5 Õ Ő ГРАММ Õ е ص Υ   Õ Ő
1101 0110 326 214 D6 Ö ж ض Φ   Ö Ö
1101 0111 327 215 D7 × з ط Χ   × Ũ × × Ś
1101 1000 330 216 D8 Ø Р ГРАММ Ø и ظ Ψ   Ø Ų Ø Ű
1101 1001 331 217 D9 Ù Ů Ù Ų й ع Ω   Ù Ų Ł Ù
1101 1010 332 218 DA Ú к غ Ϊ   Ú Ś Ú
1101 1011 333 219 БД Û Ű Û л   Ϋ   Û   Ū Û
1101 1100 334 220 ОКРУГ КОЛУМБИЯ Ü м   ά   Ü   Ü
1101 1101 335 221 DD Ý Ŭ Ũ н   έ   Я Ý   Ż Ý Ę
1101 1110 336 222 DE Þ Ţ Ŝ Ū о   ή   Ş Þ   Ž Ŷ Þ Ț
1101 1111 337 223 DF SS п   ί SS ฿ SS
1110 0000 340 224 E0 à р à ā р ـ ΰ א à ā ą à
1110 0001 341 225 E1 á с ف α ב á я á
1110 0010 342 226 E2 â т ق β ג â ā â
1110 0011 343 227 E3 ã ă   ã у ك γ ד ã ć ã ă
1110 0100 344 228 E4 ä ф ل δ ה ä ä
1110 0101 345 229 E5 å ĺ ċ å х م ε ו å å ć
1110 0110 346 230 E6 æ ć ĉ æ ц ن ζ ז æ ę æ
1110 0111 347 231 E7 ç я ч ه η ח ç я ē ç
1110 1000 350 232 E8 è č è č ш و θ ט è č č è
1110 1001 351 233 E9 é щ ى ι י é é
1110 1010 352 234 EA ê ę ê ę ъ ي κ ך ê ę ź ê
1110 1011 353 235 EB ë ы ً λ כ ë ė ë
1110 1100 354 236 EC я ě я ė ь ٌ μ ל я ė грамм я
1110 1101 355 237 ED я э ٍ ν ם я ķ я
1110 1110 356 238 EE я ю َ ξ מ я я я
1110 1111 357 239 EF я ď я я я ُ ο ן я ļ я
1111 0000 360 240 F0 ð đ   đ ِ π נ грамм ð š ŵ ð đ
1111 0001 361 241 F1 ñ ń ñ ņ ё ّ ρ ס ñ ņ ń ñ ń
1111 0010 362 242 F2 ò ň ò ō ђ ْ ς ע ò ō ņ ò
1111 0011 363 243 F3 ó ķ ѓ   σ ף ó ó
1111 0100 364 244 F4 ô є   τ פ ô ō ô
1111 0101 365 245 F5 х ő грамм х ѕ   υ ץ х ő
1111 0110 366 246 F6 ö і   φ צ ö ö
1111 0111 367 247 F7 ÷ ї   χ ק ÷ ũ ÷ ÷ ś
1111 1000 370 248 F8 ø р грамм ø ј   ψ ר ø ų ø ű
1111 1001 371 249 F9 ù ů ù ų љ   ω ש ù ų ł ù
1111 1010 372 250 FA ú њ   ϊ ת ú ś ú
1111 1011 373 251 FB û ű û ћ   ϋ   û ū û
1111 1100 374 252 FC ü ќ   ό   ü   ü
1111 1101 375 253 FD ý ŭ ũ §   ύ LRM я ý   ż ý ę
1111 1110 376 254 FE þ ţ ŝ ū ў   ώ RLM ş þ   ž ŷ þ ț
1111 1111 377 255 FF ÿ ˙ џ       ÿ ĸ   ' ÿ
Двоичный Октябрь Декабрь Шестигранник 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16

В позиции 0xA0 всегда есть неразрывный пробел, а 0xAD - это в основном мягкий дефис , который отображается только при переносе строки . Остальные пустые поля либо  не назначены или используемая система не может их отобразить.

Есть   новые дополнения в виде версий ISO / IEC 8859-7: 2003 и ISO / IEC 8859-8: 1999 . LRM означает знак слева направо (U + 200E), а RLM означает знак справа налево (U + 200F).

Связь с Unicode и UCS

С 1991 года Консорциум Unicode работает с ISO и IEC над разработкой стандарта Unicode и ISO / IEC 10646: универсального набора символов (UCS) в тандеме. Более новые редакции ISO / IEC 8859 выражают символы в терминах их имен Unicode / UCS и нотации U + nnnn , фактически заставляя каждую часть ISO / IEC 8859 быть схемой кодирования символов Unicode / UCS, которая отображает очень небольшое подмножество ПСК в одиночные 8-битные байты. Первые 256 символов в Unicode и UCS идентичны таковым в ISO / IEC-8859-1 ( Latin-1 ).

Однобайтовые наборы символов, включая части ISO / IEC 8859 и производные от них, пользовались популярностью на протяжении 1990-х годов, имея преимущества в том, что они хорошо известны и их легче реализовать в программном обеспечении: уравнение одного байта к одному символу является простым и адекватным для большинства одноязычных приложений, и здесь нет комбинирующих символов или вариантов форм. Поскольку операционные системы с поддержкой Unicode стали более распространенными, ISO / IEC 8859 и другие устаревшие кодировки стали менее популярными. В то время как остатки стандарта ISO 8859 и однобайтовых символьных моделей по-прежнему укоренились во многих операционных системах, языках программирования, системах хранения данных, сетевых приложениях, аппаратном обеспечении дисплея и прикладном программном обеспечении для конечных пользователей, большинство современных вычислительных приложений используют Unicode внутри себя и полагаются на преобразование. таблицы для сопоставления с другими кодировками, когда это необходимо.

Текущий статус

Стандарт ISO / IEC 8859 поддерживался Совместным техническим комитетом 1 ISO / IEC, Подкомитетом 2, Рабочей группой 3 (ISO / IEC JTC 1 / SC 2 / WG 3). В июне 2004 г. WG 3 была расформирована, а обязанности по обслуживанию были переданы SC 2 . Стандарт в настоящее время не обновляется, поскольку единственная оставшаяся рабочая группа Подкомитета , WG 2, концентрируется на разработке универсального набора кодированных символов Unicode .

WHATWG Encoding Standard, который указывает кодировки символов допускается в HTML5 , которые должны поддерживать совместимые браузеры, включает в себя большинство частей ИСО / МЭК 8859, для частей 1, 9 и 11, которые вместо того, чтобы интерпретировать как за исключением Windows-1252 , Windows-1254 и Винда-874 соответственно. Авторам новых страниц и разработчикам новых протоколов рекомендуется использовать вместо этого UTF-8 .

Смотрите также

Примечания

использованная литература

  • Опубликованные версии каждой части ISO / IEC 8859 доступны за плату на сайте каталога ISO и в Интернет- магазине IEC .
  • PDF-версии окончательных проектов некоторых частей ISO / IEC 8859, представленных в ISO / IEC JTC 1 / SC 2 / WG 3 для обзора и публикации, доступны на веб-сайте WG 3 :
    • ISO / IEC 8859-1: 1998 - 8-битные однобайтовые наборы графических символов, Часть 1: Латинский алфавит № 1 (черновик от 12 февраля 1998 г., опубликован 15 апреля 1998 г.)
    • ISO / IEC 8859-4: 1998 - 8-битные однобайтовые наборы графических символов, Часть 4: Латинский алфавит № 4 (черновик от 12 февраля 1998 г., опубликован 1 июля 1998 г.)
    • ISO / IEC 8859-7: 1999 - 8-битные однобайтовые наборы графических символов, Часть 7: Латинский / греческий алфавит (проект от 10 июня 1999 г .; заменен ISO / IEC 8859-7: 2003, опубликованным 10 октября). 2003)
    • ISO / IEC 8859-10: 1998 - 8-битные однобайтовые наборы графических символов, Часть 10: Латинский алфавит № 6 (черновик от 12 февраля 1998 г., опубликован 15 июля 1998 г.)
    • ISO / IEC 8859-11: 1999 - 8-битные однобайтовые наборы графических символов, Часть 11: Набор латинских / тайских символов (черновик от 22 июня 1999 г .; заменен ISO / IEC 8859-11: 2001, опубликован 15 декабря). 2001)
    • ISO / IEC 8859-13: 1998 - 8-битные однобайтовые графические наборы символов, Часть 13: Латинский алфавит № 7 (черновик от 15 апреля 1998 г., опубликован 15 октября 1998 г.)
    • ISO / IEC 8859-15: 1998 - 8-битные однобайтовые графические наборы символов, Часть 15: Латинский алфавит № 9 (черновик от 1 августа 1997 г .; заменен ISO / IEC 8859-15: 1999, опубликован 15 марта) , 1999)
    • ISO / IEC 8859-16: 2000 - 8-битные однобайтовые наборы графических символов, Часть 16: Латинский алфавит № 10 (черновик от 15 ноября 1999 г .; заменен ISO / IEC 8859-16: 2001, опубликован 15 июля) , 2001)
  • Стандарты ECMA , которые по замыслу точно соответствуют стандартам набора символов ISO / IEC 8859, можно найти по адресу:
    • Стандартный ECMA-94 : 8-битные однобайтовые графические наборы символов - латинские алфавиты с № 1 по № 4, 2-е издание (июнь 1986 г.)
    • Стандартный ECMA-113 : 8-битные однобайтовые графические наборы символов - латинский / кириллица, 3-е издание (декабрь 1999 г.)
    • Стандартный ECMA-114 : 8-битные однобайтовые графические наборы символов - латинский / арабский алфавит, 2-е издание (декабрь 2000 г.)
    • Стандартный ECMA-118 : 8-битные однобайтовые графические наборы символов - латинский / греческий алфавит (декабрь 1986 г.)
    • Стандартный ECMA-121 : 8-битные однобайтовые графические наборы символов - латинский / еврейский алфавит, 2-е издание (декабрь 2000 г.)
    • Стандартный ECMA-128 : 8-битные однобайтовые графические наборы символов - латинский алфавит № 5, 2-е издание (декабрь 1999 г.)
    • Стандартный ECMA-144 : 8-битные однобайтовые кодированные наборы символов - латинский алфавит № 6, третье издание (декабрь 2000 г.)
  • Таблицы сопоставления ISO / IEC 8859-1 в Unicode в виде текстовых файлов находятся на FTP-узле Unicode.
  • Неофициальные описания и таблицы кодов для большинства стандартов ISO / IEC 8859 доступны в ISO / IEC 8859 Alphabet Soup (Mirror).