Подстрочные и надстрочные индексы Unicode - Unicode subscripts and superscripts
Unicode имеет версии ряда символов с индексами и надстрочными индексами, включая полный набор арабских цифр . Эти символы позволяют представить любые полиномиальные , химические и некоторые другие уравнения в виде обычного текста без использования какой-либо разметки, такой как HTML или TeX .
World Wide Web Consortium и консорциум Unicode разработали рекомендации по выбору между использованием разметки и используя верхние и нижние индексы символов:
При использовании в математическом контексте ( MathML ) рекомендуется последовательно использовать разметку стилей для надстрочных и подстрочных индексов .... Однако, когда надстрочные и подскрипты должны отражать семантические различия, легче работать с этими значениями, закодированными в тексте. чем разметка, например, в фонетической или фонематической транскрипции .
Использует
Предназначено использовать , когда эти символы были добавлены в Unicode должны были позволить химическим и алгебраическим формулам и фонетике быть написаны без разметки, но дает истинные надстрочные и подстрочные. Таким образом, предполагается, что «H₂O» (с использованием символа нижнего индекса) идентично «H 2 O» (с разметкой нижнего индекса).
На самом деле большинство шрифтов, которые включают эти символы, игнорируют определение Unicode и создают цифры для глифов математического числителя и знаменателя , которые меньше обычных символов, но выровнены по верхней и базовой линиям соответственно. При использовании с солидусом эти глифы полезны для создания произвольных диагональных дробей (аналогично глифу ½ ). Создание фракции с использованием существующего программного обеспечения супер / подстрочный требует много символов и не выглядит как оказанная дробь (пример: +1 / +2 ), поэтому дизайнеры шрифтов при условии , этой альтернативы. Это также делает надстрочные буквы полезными для порядковых указателей , более точно совпадающих с символами ª и º. Однако это делает их неправильными для обычных надстрочных и нижних индексов, а формулы отображаются правильно с использованием разметки, а не этих символов.
Unicode предназначен для получения диагональных дробей с помощью другого механизма, но он очень плохо поддерживается. Фракцию слэш U + 2044 визуально похож на солидуса, но при использовании обычных цифр ( а не верхние и нижние индексы) предназначена сказать систему компоновки , что часть таких , как ¾ должна быть визуализированы с использованием автоматической подстановки глифов для цифр . Некоторые браузеры поддерживают это, но не во всех шрифтах. Выбор шрифтов показан в таблице ниже.
Символы | Шрифт | Результат |
---|---|---|
U + 00BD ½ ВУЛГАРНАЯ ФРАКЦИЯ ОДНА ПОЛОВИНА | Дефолт | ½ |
U + 00B9 ¹ ПОДПИСАТЬСЯ НА ОДИН , U + 002F / SOLIDUS , U + 2082 ₂ ПОДПИСАТЬСЯ НА ВТОРОЙ | ¹ / ₂ | |
U + 00B9 ¹ Superscript ONE , U + 2044 / ФРАКЦИИ Слэш , U + 2082 ₂ Подстрочный ДВА | ¹⁄₂ | |
U + 0031 1 ЦИФРА ОДИН , U + 2044 ⁄ ДРОБНАЯ ПЕРЕЧЕРСТЬ , U + 0032 2 ЦИФРА ВТОРАЯ |
1⁄2 | |
Arial | 1⁄2 | |
Камбрия | 1⁄2 | |
Consolas | 1⁄2 | |
Times New Roman | 1⁄2 | |
FiraGO | 1⁄2 | |
Э.Б. Гарамонд | 1⁄2 | |
Cantarell | 1⁄2 | |
Лато | 1⁄2 | |
Linux Libertine O | 1⁄2 | |
Нимбус Роман | 1⁄2 | |
Ubuntu | 1⁄2 | |
Yrsa | 1⁄2 |
Блок надстрочных и подстрочных индексов
Наиболее распространенные цифры надстрочного индекса (1, 2 и 3) были в ISO-8859-1 и поэтому были перенесены в эти позиции в диапазоне Latin-1 Unicode. Остальные были размещены в специальном разделе Unicode от U + 2070 до U + 209F. В двух таблицах ниже показаны эти символы. Каждому надстрочному или надстрочному символу предшествует нормальный x, чтобы показать подстрочный / надстрочный индекс. Таблица слева содержит фактические символы Юникода; один справа содержит эквиваленты, использующие разметку HTML для подстрочного или надстрочного индекса.
|
|
Другие надстрочные и подстрочные символы
Unicode версии 13.0 также включает символы нижнего и верхнего индекса, которые предназначены для семантического использования, в следующих блоках:
- Надстрочный
- Блок Latin-1 Supplement содержит порядковые указатели женского и мужского рода ª и º.
- Блок Latin Extended-C содержит один дополнительный верхний индекс,.
- Блок Latin Extended-D содержит пять надстрочных индексов: ꝰ ꟸ ꟹ ꟲ ꟳ.
- Блок Latin Extended-E содержит пять надстрочных знаков: ꭜ ꭝ ꭞ ꭟ ꭩ.
- Блок Latin Extended-F полностью состоит из надстрочных индексов.
- В блоке букв модификатора интервала есть надстрочные буквы и символы, используемые для фонетической транскрипции: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ˀ ˁ ˠ ˢ ˣ ˤ.
- Блок Phonetic Extensions содержит несколько надстрочных букв и символов: Latin / IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵁ ᵂ ᵃ ᵄ ᵅ ᵈ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, греческий ᵝ ᵞ ᵟ ᵠ, кириллица ᵸ, другие ᵎ ᵔ ᵕ ᵙ ᵜ. Они предназначены для обозначения вторичной артикуляции .
- В блоке Phonetic Extensions Supplement есть еще несколько: Latin / IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶱ ᶲ ᶳ ᶴ ᶷ ᶺ ᶻ ᶼ ᶽ ᶾ, греческий ᶿ.
- Блок Cyrillic Extended-B содержит два кириллических надстрочных индекса: ꚜ ꚝ.
- Грузинский блок содержит один верхний индекс мхедрул письмо: ჼ.
- Блок Канбун имеет надстрочные символы аннотации, используемые в японских копиях классических китайских текстов: ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆙ ㆛ ㆜ ㆝ ㆞ ㆟.
- Тифинаг блок имеет один надстрочное письмо: ⵯ.
- Единый Канадские слоговые и его расширенные блоки содержат несколько основном согласные -Только букв для обозначения слогов коды под названием финалы, наряду с некоторыми персонажами , которые указуют на слог медиального известные как Medials: Основной блок ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐢ ᐣ ᐤ ᐥ ᐦ ᐧ ᐨ ᐩ ᐪ ᑉ ᑊ ᑋ ᒃ ᒄ ᒡ ᒢ ᒻ ᒼ ᓐ ᓑ ᓒ ᓪ ᓫ ᔅ ᔆ ᔉ ᔊ ᔋ ᔥ ᔾ ᔿ ᕀ ᕁ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖦ ᖮ ᗮ ᘁ ᙚ ; Расширенный блок: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.
- Комбинирование надстрочного индекса
- Блок « Объединение диакритических знаков» содержит средневековые диакритические знаки надстрочных букв. Эти буквы написаны непосредственно над другими буквами, встречающимися в средневековых германских рукописях, поэтому эти глифы не содержат пробелов, например uͤ. Они показаны здесь над заполнителем в виде пунктирного круга ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
- Блок Combining Diacritical Marks Extended содержит две комбинированные буквы для лингвистической транскрипции шотландского языка : ◌ᪿ ◌ᫀ.
- Блок « Дополнение к комбинированным диакритическим знакам» содержит дополнительные средневековые диакритические знаки надстрочных букв, достаточные для завершения основного латинского алфавита в нижнем регистре, за исключением j, q и y, нескольких заглавных букв и лигатур (ae, ao, av) и дополнительных букв: ◌ᷓ ◌ ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷝ ◌ᷞ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ.
- Кириллица Extended-A и -B блоки содержат множество средневековых надстрочных букв диакритические, достаточно , чтобы завершить основные строчные кириллицы , используемые в текстах церковнославянских, также включают в себя дополнительные лигатуры (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷮ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
- Нижний индекс
- Блок Latin Extended-C содержит один дополнительный нижний индекс,.
- Блок Phonetic Extensions содержит несколько подписанных букв и символов: Latin / IPA ᵢ ᵣ ᵤ ᵥ и греческий ᵦ ᵧ ᵨ ᵩ ᵪ.
- Комбинируя нижний индекс
- Блок « Дополнение к объединяющим диакритическим знакам» содержит объединяющий нижний индекс: ◌᷊.
Латинские, греческие и кириллические таблицы
В сводном виде стандарт Unicode содержит версии надстрочного и подстрочного символов подмножества латинских, греческих и кириллических букв. Здесь они расположены в алфавитном порядке для сравнения (или для удобства копирования и вставки). Поскольку эти символы появляются в разных диапазонах Unicode, они могут отличаться по размеру или положению из-за замены шрифта в браузере. Заштрихованные ячейки отмечают заглавные буквы, которые не очень отличаются от минускул, и греческие буквы, которые неотличимы от латинских, и поэтому не ожидается, что они будут поддерживаться Unicode.
А | B | C | D | E | F | грамм | ЧАС | я | J | K | L | M | N | О | п | Q | р | S | Т | U | V | W | Икс | Y | Z | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Заглавная надстрочная буква | ᴬ | ᴮ | ꟲ | ᴰ | ᴱ | ꟳ | ᴳ | ᴴ | ᴵ | ᴶ | ᴷ | ᴸ | ᴹ | ᴺ | ᴼ | ᴾ | ꟴ | ᴿ | ᵀ | ᵁ | ⱽ | ᵂ | ||||
Надстрочная маленькая заглавная буква | 𐞄 | 𐞒 | 𐞖 | ᶦ | ᶫ | ᶰ | 𐞪 | ᶸ | 𐞲 | |||||||||||||||||
Минускул надстрочный | ᵃ | ᵇ | ᶜ | ᵈ | ᵉ | ᶠ | ᵍ | ʰ | ⁱ | ʲ | ᵏ | ˡ | ᵐ | ⁿ | ᵒ | ᵖ | 𐞥 | ʳ | ˢ | ᵗ | ᵘ | ᵛ | ʷ | ˣ | ʸ | ᶻ |
Небольшая заглавная буква Overscript | ◌ᷛ | ◌ᷞ | ◌ᷟ | ◌ᷡ | ◌ᷢ | |||||||||||||||||||||
Минускул надстрочного текста | ◌ͣ | ◌ᷨ | ◌ͨ | ◌ͩ | ◌ͤ | ◌ᷫ | ◌ᷚ | ◌ͪ | ◌ͥ | ◌ᷜ | ◌ᷝ | ◌ͫ | ◌ᷠ | ◌ͦ | ◌ᷮ | ◌ͬ | ◌ᷤ | ◌ͭ | ◌ͧ | ◌ͮ | ◌ᷱ | ◌ͯ | ◌ᷦ | |||
Подстрочный минускул | ₐ | ₑ | ₕ | ᵢ | ⱼ | ₖ | ₗ | ₘ | ₙ | ₒ | ₚ | ᵣ | ₛ | ₜ | ᵤ | ᵥ | ₓ | |||||||||
Подчеркнутый минускул | ◌᷊ | ◌ᪿ |
Α | Β | Γ | Δ | Ε | Ζ | Η | Θ | Ι | Κ | Λ | Μ | Ν | Ξ | Ο | Π | Ρ | Σ | Τ | Υ | Φ | Χ | Ψ | Ω | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Минускул надстрочный | ᵝ | ᵞ | ᵟ | ⁽ᵋ⁾ | ᶿ | ⁽ᶥ⁾ | ⁽ᶹ⁾ | ᵠ | ᵡ | |||||||||||||||
Минускул надстрочного текста | ◌ᷩ | |||||||||||||||||||||||
Подстрочный минускул | ᵦ | ᵧ | ᵨ | ᵩ | ᵪ |
Для базового IPA см. Надстрочные буквы IPA . Другие фонетические символы:
ɑ | æ | ç | ð | ə | ɩ | ᶅ | ʃ | ƫ | ʍ | ʔ | |
---|---|---|---|---|---|---|---|---|---|---|---|
Надстрочный | ᵅ | 𐞃 | ᶜ̧ | ᶞ | ᵊ | ᶥ | ᶪ | ᶴ | ᶵ | ꭩ | ˀ |
Надпись | ◌ᷧ | ◌ᷔ | ◌ᷗ | ◌ᷙ | ◌ᷪ | ◌ᷯ | ◌̉ | ||||
Нижний индекс | ₔ | ||||||||||
Underscript | ◌ᫀ |
А | Ә | Е | Є | И | І | Ї | О | Ө | У | Ү | Ꙋ | Ѡ | Ъ | ЪІ | Ы | Ь | Ѣ | Ꙗ | Э | Ѥ | Ю | Ѫ | Ѭ | Ѧ | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Надстрочный | * | * | * | * | * | - | * | * | * | * | ꚜ | * | * | ꚝ | * | * | |||||||||
Надпись | ◌ⷶ | ◌ⷷ | ◌ꙴ | ◌ꙵ | ◌ꙶ | ◌ⷪ | ◌ꙷ | ◌ⷹ | ◌ꙻ | ◌ꙸ | ◌ꙹ | ◌ꙺ | ◌ⷺ | ◌ⷼ | ◌ꚟ | ◌ⷻ | ◌ⷾ | ◌ⷿ | ◌ⷽ | ||||||
Нижний индекс | * | * | * | * | - | * | * | * | * | ||||||||||||||||
Б | В | Г | Ґ | Д | Ж | З | S | К | Л | М | Н | П | Р | С | Т | Ф | Х | Ц | Ч | Џ | Ш | Щ | Ѳ | ||
Надстрочный | * | * | * | * | * | * | * | * | * | ᵸ | * | * | * | * | * | * | * | * | * | ||||||
Надпись | ◌ⷠ | ◌ⷡ | ◌ⷢ | ◌ⷣ | ◌ⷤ | ◌ⷥ | ◌ⷦ | ◌ⷧ | ◌ⷨ | ◌ⷩ | ◌ⷫ | ◌ⷬ | ◌ⷭ | ◌ⷮ | ◌ꚞ | ◌ⷯ | ◌ⷰ | ◌ⷱ | ◌ⷲ | ◌ⷳ | ◌ⷴ | ||||
Нижний индекс | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * |
* Допускаются символы для Unicode 15, который будет опубликован в 2022 году.
См. Также строчные буквы в Юникоде .
Составные персонажи
В первую очередь для совместимости с более ранними наборами символов Unicode содержит ряд символов, которые составляют надстрочные и подстрочные индексы с другими символами. В большинстве шрифтов они отображаются намного лучше, чем попытки построить эти символы из указанных выше символов или с помощью разметки.
- Блок Latin-1 Supplement содержит предварительно составленные дроби ½, ¼ и ¾. Авторские права © и зарегистрированные товарные знаки знаки ® также в этом блоке.
- Блок общей пунктуации содержит знак промилле ‰ и знак десяти тысяч , а базовая латынь имеет знак процента %.
- Блок Number Forms содержит несколько заранее составленных дробей: ⅐ ⅑ ⅒ ⅓ ⅔ ⅕ ⅖ ⅗ ⅘ ⅙ ⅚ ⅛ ⅜ ⅝ ⅞ ⅟ ↉.
- Блок « Буквоподобные символы» содержит несколько символов, состоящих из подстрочных и надстрочных знаков: ℀ ℁ ℅ ℆ № ℠ ™ ⅍.
- Закрываемый Дополнение буквенно - цифровой блок содержит три надстрочный аббревиатуры 🅪 🅫 🅬: MC для капера де торговли ( товарный знак ), MD для капер déposée ( зарегистрированный товарный знак ), и используется в Канаде; MR для marca registrada (зарегистрированная торговая марка) в испаноязычных и португалоговорящих странах
- Блок « Разное» имеет один дополнительный индекс, индекс 10 (⏨), для научного обозначения .
- Единый Канадские слоговые и его расширенные блоки содержат несколько букв , скомпонованных с помощью верхнего индекса букв указать расширенные значения звука: Основной блок ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑧ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᓮ ᔌ ᔍ ᔎ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙵ ᙶ, Расширенный блок ᢰ ᢱ ᢲ ᢳ ᢴ ᢵ ᢶ ᢸ ᢹ ᢺ ᢻ ᢽ ᣀ ᣁ ᣂ ᣃ ᣄ ᣅ.