Формы половинной и полной ширины - Halfwidth and fullwidth forms
В CJK (китайский, японский и корейский) вычислительных, графических символов традиционно классифицируются в Полноширинный (в Тайване и Гонконге :全形, в CJK:全角) и полуширина (в Тайване и Гонконге :半形, в CJK:半角) персонажи. В отличие от моноширинных шрифтов , символ половинной ширины занимает половину ширины символа полной ширины, отсюда и название.
Формы половинной и полной ширины - это также имя блока Unicode U + FF00 – FFEF, при условии, что старые кодировки, содержащие символы как половинной, так и полной ширины, могут иметь перевод без потерь в / из Unicode.
Обоснование
Во времена использования текстового режима символы западного алфавита обычно располагались на экране в виде сетки, часто 80 столбцов на 24 или 25 строк. Каждый символ отображался в виде небольшой точечной матрицы , часто шириной около 8 пикселей , а для кодирования символов западных языков обычно использовался SBCS (однобайтовый набор символов).
По эстетическим соображениям и удобочитаемости предпочтительно, чтобы символы Han были приблизительно квадратной формы, то есть вдвое шире, чем эти символы SBCS фиксированной ширины. Поскольку они обычно кодировались в формате DBCS (двухбайтовый набор символов), это также означало, что их ширина на экране с использованием дуоширинного шрифта была пропорциональна их длине байта. Некоторые терминалы и программы редактирования не могли обрабатывать двухбайтовые символы, начинающиеся с нечетных столбцов, только четные (некоторые не могли даже помещать двухбайтовые и однобайтовые символы в одну строку). Таким образом, наборы DBCS обычно включали также латинские символы и цифры для использования вместе с символами CJK в одной строке.
С другой стороны, ранние японские вычисления использовали однобайтовую кодовую страницу под названием JIS X 0201 для катаканы . Они будут отображаться с той же шириной, что и другие однобайтовые символы, что сделает их символами кана половинной ширины, а не кана с нормальными пропорциями. Хотя сам стандарт JIS X 0201 не определяет отображение половинной ширины для катаканы, это стало визуально отличительной особенностью Shift JIS между однобайтовой катаканой JIS X 0201 и двухбайтовой катаканой JIS X 0208 . Некоторые кодовые страницы IBM использовали аналогичную обработку для корейского джамо , основанную на N- байтовом коде хангыль и его переводе EBCDIC .
В Юникоде
Для совместимости с существующими наборами символов, которые содержали версии одного и того же символа как с половинной, так и с полной шириной, Unicode выделил один блок в U + FF00 – FFEF, содержащий необходимые символы «альтернативной ширины». Это включает в себя Полноширинную версию всех ASCII символов , а некоторые не-ASCII знаков препинания , такие как знак йены, полуширина версия катакана и хангылите и полуширину версия некоторых других символов , такие как окружность. Были выделены только символы, необходимые для обхода без потерь к существующим наборам символов, а не (например) создание полноразмерной версии каждого символа с латинским акцентом.
Юникод присваивает каждой кодовой точке свойство «ширина Восточной Азии» . Это может быть:
Сокращенное название | Имя | Описание |
---|---|---|
W | Широкий | Естественно широкий характер, например Хирагана . |
Na | Узкий | Естественно узкий символ, например, базовый латинский алфавит ISO . |
F | Полная ширина | Широкий вариант с нормализацией совместимости до естественно узких символов, например, полноразмерный латинский шрифт. |
ЧАС | Половина ширины | Узкий вариант с нормализацией совместимости до естественно широкого символа, например кана половинной ширины . Включает U + 20A9 ( ₩ ) в качестве исключения. |
А | Двусмысленный | Символы включены в коды DBCS для Восточной Азии, а также в коды SBCS для Европы, например, греческий алфавит . Следовательно, дуоширинное поведение может варьироваться. |
N | Нейтральный | Символы, которых нет в восточноазиатских кодах DBCS, например Деванагари . |
Эмуляторы терминала могут использовать это свойство, чтобы решить, должен ли персонаж использовать один или два «столбца» при определении вкладок и положения курсора.
В OpenType
OpenType имеет теги функций "fwid", "halt", "hwid" и "vhal", которые используются для обеспечения полной или половинной ширины символа.
Смотрите также
- Ханьское объединение
- Восточноазиатская пунктуация
- Em size - формы полной ширины
- Хангыль Джамо (блок Unicode)
- Катакана (блок Unicode)
- Латинский шрифт в Юникоде
- Вложенные буквенно-цифровые символы - последовательности маркеров, некоторые отображаются в полную ширину (например, ⒈, ⓵, ⑴, ⒜, ⓐ)
использованная литература
внешние ссылки
- Приложение № 11 к стандарту восточноазиатской ширины Unicode