Подстрочные и надстрочные индексы Unicode - Unicode subscripts and superscripts

Разница между глифами надстрочного / подстрочного и числителя / знаменателя. Во многих популярных шрифтах символы Unicode «надстрочный» и «подстрочный» фактически являются глифами числителя и знаменателя.

Unicode имеет версии ряда символов с индексами и надстрочными индексами, включая полный набор арабских цифр . Эти символы позволяют представить любые полиномиальные , химические и некоторые другие уравнения в виде обычного текста без использования какой-либо разметки, такой как HTML или TeX .

World Wide Web Consortium и консорциум Unicode разработали рекомендации по выбору между использованием разметки и используя верхние и нижние индексы символов:

При использовании в математическом контексте ( MathML ) рекомендуется последовательно использовать разметку стилей для надстрочных и подстрочных индексов .... Однако, когда надстрочные и подскрипты должны отражать семантические различия, легче работать с этими значениями, закодированными в тексте. чем разметка, например, в фонетической или фонематической транскрипции .

Использует

Предназначено использовать , когда эти символы были добавлены в Unicode должны были позволить химическим и алгебраическим формулам и фонетике быть написаны без разметки, но дает истинные надстрочные и подстрочные. Таким образом, предполагается, что «H₂O» (с использованием символа нижнего индекса) идентично «H 2 O» (с разметкой нижнего индекса).

На самом деле большинство шрифтов, которые включают эти символы, игнорируют определение Unicode и создают цифры для глифов математического числителя и знаменателя , которые меньше обычных символов, но выровнены по верхней и базовой линиям соответственно. При использовании с солидусом эти глифы полезны для создания произвольных диагональных дробей (аналогично глифу ½ ). Создание фракции с использованием существующего программного обеспечения супер / подстрочный требует много символов и не выглядит как оказанная дробь (пример: +1 / +2 ), поэтому дизайнеры шрифтов при условии , этой альтернативы. Это также делает надстрочные буквы полезными для порядковых указателей , более точно совпадающих с символами ª и º. Однако это делает их неправильными для обычных надстрочных и нижних индексов, а формулы отображаются правильно с использованием разметки, а не этих символов.

Unicode предназначен для получения диагональных дробей с помощью другого механизма, но он очень плохо поддерживается. Фракцию слэш U + 2044 визуально похож на солидуса, но при использовании обычных цифр ( а не верхние и нижние индексы) предназначена сказать систему компоновки , что часть таких , как ¾ должна быть визуализированы с использованием автоматической подстановки глифов для цифр . Некоторые браузеры поддерживают это, но не во всех шрифтах. Выбор шрифтов показан в таблице ниже.

Сравнение кодировок простых дробей
Символы Шрифт Результат
U + 00BD ½ ВУЛГАРНАЯ ФРАКЦИЯ ОДНА ПОЛОВИНА Дефолт ½
U + 00B9 ¹ ПОДПИСАТЬСЯ НА ОДИН , U + 002F / SOLIDUS , U + 2082 ПОДПИСАТЬСЯ НА ВТОРОЙ ¹ / ₂
U + 00B9 ¹ Superscript ONE , U + 2044 / ФРАКЦИИ Слэш , U + 2082 Подстрочный ДВА ¹⁄₂
U + 0031 1 ЦИФРА ОДИН ,
U + 2044 ДРОБНАЯ ПЕРЕЧЕРСТЬ ,
U + 0032 2 ЦИФРА ВТОРАЯ
1⁄2
Arial 1⁄2
Камбрия 1⁄2
Consolas 1⁄2
Times New Roman 1⁄2
FiraGO 1⁄2
Э.Б. Гарамонд 1⁄2
Cantarell 1⁄2
Лато 1⁄2
Linux Libertine O 1⁄2
Нимбус Роман 1⁄2
Ubuntu 1⁄2
Yrsa 1⁄2

Блок надстрочных и подстрочных индексов

Наиболее распространенные цифры надстрочного индекса (1, 2 и 3) были в ISO-8859-1 и поэтому были перенесены в эти позиции в диапазоне Latin-1 Unicode. Остальные были размещены в специальном разделе Unicode от U + 2070 до U + 209F. В двух таблицах ниже показаны эти символы. Каждому надстрочному или надстрочному символу предшествует нормальный x, чтобы показать подстрочный / надстрочный индекс. Таблица слева содержит фактические символы Юникода; один справа содержит эквиваленты, использующие разметку HTML для подстрочного или надстрочного индекса.

Символы Юникода
0 1 2 3 4 5 6 7 8 9 А B C D E F
U + 00Bx
U + 207x x⁰ xⁱ x⁴ x⁵ x⁶ x⁷ x⁸ x⁹ x⁺ x⁻ x⁼ Икс⁽ Икс⁾ xⁿ
U + 208x x₀ x₁ x₂ x₃ x₄ x₅ x₆ x₇ x₈ x₉ x₊ x₋ x₌ Икс₍ Икс₎
U + 209x xₐ xₑ xₒ xₓ xₔ xₕ xₖ xₗ xₘ xₙ xₚ xₛ xₜ
Имитация с использованием тегов <sup>или<sub>
0 1 2 3 4 5 6 7 8 9 А B C D E F
U + 00Bx х 2 х 3 х 1
U + 207x х 0 х я х 4 х 5 х 6 х 7 х 8 х 9 х + х - х = х ( х ) х п
U + 208x х 0 х 1 х 2 х 3 х 4 х 5 х 6 х 7 х 8 х 9 х + х - х = х ( х )
U + 209x х а х е х о х х х ə х ч х к x l х м х п х р х с х т
  Зарезервировано для использования в будущем.
  Остальные символы из Latin-1, не относящиеся к супер- или субскриптам.

Другие надстрочные и подстрочные символы

Unicode версии 13.0 также включает символы нижнего и верхнего индекса, которые предназначены для семантического использования, в следующих блоках:

Надстрочный
  • Блок Latin-1 Supplement содержит порядковые указатели женского и мужского рода ª и º.
  • Блок Latin Extended-C содержит один дополнительный верхний индекс,.
  • Блок Latin Extended-D содержит пять надстрочных индексов: ꝰ ꟸ ꟹ ꟲ ꟳ.
  • Блок Latin Extended-E содержит пять надстрочных знаков: ꭜ ꭝ ꭞ ꭟ ꭩ.
  • Блок Latin Extended-F полностью состоит из надстрочных индексов.
  • В блоке букв модификатора интервала есть надстрочные буквы и символы, используемые для фонетической транскрипции: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ˀ ˁ ˠ ˢ ˣ ˤ.
  • Блок Phonetic Extensions содержит несколько надстрочных букв и символов: Latin / IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵁ ᵂ ᵃ ᵄ ᵅ ᵈ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, греческий ᵝ ᵞ ᵟ ᵠ, кириллица ᵸ, другие ᵎ ᵔ ᵕ ᵙ ᵜ. Они предназначены для обозначения вторичной артикуляции .
  • В блоке Phonetic Extensions Supplement есть еще несколько: Latin / IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶱ ᶲ ᶳ ᶴ ᶷ ᶺ ᶻ ᶼ ᶽ ᶾ, греческий ᶿ.
  • Блок Cyrillic Extended-B содержит два кириллических надстрочных индекса: ꚜ ꚝ.
  • Грузинский блок содержит один верхний индекс мхедрул письмо: ჼ.
  • Блок Канбун имеет надстрочные символы аннотации, используемые в японских копиях классических китайских текстов: ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆙ ㆛ ㆜ ㆝ ㆞ ㆟.
  • Тифинаг блок имеет один надстрочное письмо: ⵯ.
  • Единый Канадские слоговые и его расширенные блоки содержат несколько основном согласные -Только букв для обозначения слогов коды под названием финалы, наряду с некоторыми персонажами , которые указуют на слог медиального известные как Medials: Основной блок ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐢ ᐣ ᐤ ᐥ ᐦ ᐧ ᐨ ᐩ ᐪ ᑉ ᑊ ᑋ ᒃ ᒄ ᒡ ᒢ ᒻ ᒼ ᓐ ᓑ ᓒ ᓪ ᓫ ᔅ ᔆ ᔉ ᔊ ᔋ ᔥ ᔾ ᔿ ᕀ ᕁ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖦ ᖮ ᗮ ᘁ ᙚ ; Расширенный блок: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.
Комбинирование надстрочного индекса
  • Блок « Объединение диакритических знаков» содержит средневековые диакритические знаки надстрочных букв. Эти буквы написаны непосредственно над другими буквами, встречающимися в средневековых германских рукописях, поэтому эти глифы не содержат пробелов, например uͤ. Они показаны здесь над заполнителем в виде пунктирного круга ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
  • Блок Combining Diacritical Marks Extended содержит две комбинированные буквы для лингвистической транскрипции шотландского языка : ◌ᪿ ◌ᫀ.
  • Блок « Дополнение к комбинированным диакритическим знакам» содержит дополнительные средневековые диакритические знаки надстрочных букв, достаточные для завершения основного латинского алфавита в нижнем регистре, за исключением j, q и y, нескольких заглавных букв и лигатур (ae, ao, av) и дополнительных букв: ◌ᷓ ◌ ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷝ ◌ᷞ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ.
  • Кириллица Extended-A и -B блоки содержат множество средневековых надстрочных букв диакритические, достаточно , чтобы завершить основные строчные кириллицы , используемые в текстах церковнославянских, также включают в себя дополнительные лигатуры (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷮ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
Нижний индекс
  • Блок Latin Extended-C содержит один дополнительный нижний индекс,.
  • Блок Phonetic Extensions содержит несколько подписанных букв и символов: Latin / IPA ᵢ ᵣ ᵤ ᵥ и греческий ᵦ ᵧ ᵨ ᵩ ᵪ.
Комбинируя нижний индекс
  • Блок « Дополнение к объединяющим диакритическим знакам» содержит объединяющий нижний индекс: ◌᷊.

Латинские, греческие и кириллические таблицы

В сводном виде стандарт Unicode содержит версии надстрочного и подстрочного символов подмножества латинских, греческих и кириллических букв. Здесь они расположены в алфавитном порядке для сравнения (или для удобства копирования и вставки). Поскольку эти символы появляются в разных диапазонах Unicode, они могут отличаться по размеру или положению из-за замены шрифта в браузере. Заштрихованные ячейки отмечают заглавные буквы, которые не очень отличаются от минускул, и греческие буквы, которые неотличимы от латинских, и поэтому не ожидается, что они будут поддерживаться Unicode.

Латинские надстрочные и подстрочные буквы
А B C D E F грамм ЧАС я J K L M N О п Q р S Т U V W Икс Y Z
Заглавная надстрочная буква ᴿ
Надстрочная маленькая заглавная буква 𐞄 𐞒 𐞖 𐞪 𐞲
Минускул надстрочный ʰ ʲ ˡ 𐞥 ʳ ˢ ʷ ˣ ʸ
Небольшая заглавная буква Overscript ◌ᷛ ◌ᷞ ◌ᷟ ◌ᷡ ◌ᷢ
Минускул надстрочного текста ◌ͣ ◌ᷨ ◌ͨ ◌ͩ ◌ͤ ◌ᷫ ◌ᷚ ◌ͪ ◌ͥ ◌ᷜ ◌ᷝ ◌ͫ ◌ᷠ ◌ͦ ◌ᷮ ◌ͬ ◌ᷤ ◌ͭ ◌ͧ ◌ͮ ◌ᷱ ◌ͯ ◌ᷦ
Подстрочный минускул
Подчеркнутый минускул ◌᷊ ◌ᪿ
Греческие надстрочные и подстрочные буквы
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Минускул надстрочный ⁽ᵋ⁾ ᶿ ⁽ᶥ⁾ ⁽ᶹ⁾
Минускул надстрочного текста ◌ᷩ
Подстрочный минускул

Для базового IPA см. Надстрочные буквы IPA . Другие фонетические символы:

другие надстрочные и подстрочные буквы IPA
ɑ æ ç ð ə ɩ ʃ ƫ ʍ ʔ
Надстрочный 𐞃 ᶜ̧ ˀ
Надпись ◌ᷧ ◌ᷔ ◌ᷗ ◌ᷙ ◌ᷪ ◌ᷯ ◌̉
Нижний индекс
Underscript ◌ᫀ
Кириллица надстрочные и подстрочные буквы
А Ә Е Є И І Ї О Ө У Ү Ѡ Ъ ЪІ Ы Ь Ѣ Э Ѥ Ю Ѫ Ѭ Ѧ
Надстрочный * * * * * - * * * * * * * *
Надпись ◌ⷶ ◌ⷷ ◌ꙴ ◌ꙵ ◌ꙶ ◌ⷪ ◌ꙷ ◌ⷹ ◌ꙻ ◌ꙸ ◌ꙹ ◌ꙺ ◌ⷺ ◌ⷼ ◌ꚟ ◌ⷻ ◌ⷾ ◌ⷿ ◌ⷽ
Нижний индекс * * * * - * * * *
Б В Г Ґ Д Ж З S К Л М Н П Р С Т Ф Х Ц Ч Џ Ш Щ Ѳ
Надстрочный * * * * * * * * * * * * * * * * * *
Надпись ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ꚞ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ
Нижний индекс * * * * * * * * * * * * * * * * * *

* Допускаются символы для Unicode 15, который будет опубликован в 2022 году.

См. Также строчные буквы в Юникоде .

Составные персонажи

В первую очередь для совместимости с более ранними наборами символов Unicode содержит ряд символов, которые составляют надстрочные и подстрочные индексы с другими символами. В большинстве шрифтов они отображаются намного лучше, чем попытки построить эти символы из указанных выше символов или с помощью разметки.

  • Единый Канадские слоговые и его расширенные блоки содержат несколько букв , скомпонованных с помощью верхнего индекса букв указать расширенные значения звука: Основной блок ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑧ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᓮ ᔌ ᔍ ᔎ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙵ ᙶ, Расширенный блок ᢰ ᢱ ᢲ ᢳ ᢴ ᢵ ᢶ ᢸ ᢹ ᢺ ᢻ ᢽ ᣀ ᣁ ᣂ ᣃ ᣄ ᣅ.

Примечания

использованная литература