Обозначение регионального индикатора - Regional indicator symbol
В символах региональных индикаторов представляют собой набор из 26 алфавитных Unicode символов (A-Z) , предназначенные для использования для кодирования 3166-1 альфа - 2-ISO двухбуквенных кодов стран таким образом , что позволяет дополнительно специальной обработке.
Они были определены в как часть поддержки Unicode 6.0 для эмодзи , как альтернатива кодированию отдельных символов для каждого флага страны. Хотя они могут отображаться как латинские буквы, предполагается, что реализации могут выбрать отображение их другими способами, например, с помощью национальных флагов . В FAQ по Unicode указано, что этот механизм следует использовать и что символы национальных флагов не будут кодироваться напрямую.
Они кодируются в диапазоне от
U + 1F1E6 СИМВОЛ РЕГИОНАЛЬНОГО ИНДИКАТОРА БУКВА A (HTML 🇦
) до U + 1F1FF 🇿 СИМВОЛ РЕГИОНАЛЬНОГО ИНДИКАТОРА БУКВА Z (HTML 🇿
) в блоке закрытого буквенно- цифрового дополнения на дополнительной многоязычной плоскости .
Последовательности флагов эмодзи
Пара символов региональных индикаторов называется последовательностью флагов эмодзи (хотя она представляет конкретную область, а не конкретный флаг для этой области).
Из 676 возможных пар символов региональных индикаторов (26 × 26) только 270 считаются действительными кодами регионов Unicode. Это подмножество последовательностей регионов в репозитории общих локальных данных (CLDR):
- Все 256 последовательностей регулярных областей в CLDR
- 249 официально присвоенных кодов ISO 3166-1 alpha-2
- 6 исключительных резерваций (остров Вознесения, остров Клиппертон, Диего-Гарсия, Сеута и Мелилья, Канарские острова и Тристан-да-Кунья)
- 1 присвоенный пользователем временный код страны (Косово)
- Две из 35 последовательностей макрорегионов в CLDR (ЕС и ООН)
- Все 12 устаревших последовательностей областей в CLDR (настоятельно не рекомендуется - предназначены только для обратной совместимости)
устарел | замена | ||||
---|---|---|---|---|---|
код | область | флаг | код | область | возможный рендеринг |
AN | Нидерландские Антильские острова | 🇨🇼 | CW | Кюрасао | |
🇸🇽 | SX | Синт-Мартен | |||
🇧🇶 | BQ | Карибские Нидерланды | |||
BU | Бирма | 🇲🇲 | ММ | Мьянма (Бирма) | |
CS | Сербия и Черногория | 🇷🇸 | RS | Сербия | |
🇲🇪 | МЕНЯ | Черногория | |||
DD | Германская Демократическая Республика | 🇩🇪 | DE | Германия | |
FX | Метрополитен Франция | 🇫🇷 | FR | Франция | |
NT | Нейтральная зона | 🇸🇦 | SA | Саудовская Аравия | |
🇮🇶 | IQ | Ирак | |||
QU | Европейский Союз | 🇪🇺 | ЕС | Европейский Союз | |
SU | Союз Советских Социалистических Республик | 🇷🇺 | RU | Россия | |
🇦🇲 | ЯВЛЯЮСЬ | Армения | |||
🇦🇿 | Аризона | Азербайджан | |||
🇧🇾 | К | Беларусь | |||
🇪🇪 | EE | Эстония | |||
🇬🇪 | GE | Грузия | |||
🇰🇿 | KZ | Казахстан | |||
🇰🇬 | КГ | Кыргызстан | |||
🇱🇻 | LV | Латвия | |||
🇱🇹 | LT | Литва | |||
🇲🇩 | MD | Молдова | |||
🇹🇯 | TJ | Таджикистан | |||
🇹🇲 | TM | Туркменистан | |||
🇺🇦 | UA | Украина | |||
🇺🇿 | UZ | Узбекистан | |||
TP | Восточный Тимор | 🇹🇱 | TL | Тимор-Лешти | |
YD | Демократический Йемен | 🇾🇪 | ВЫ | Йемен | |
YU | Югославия | 🇷🇸 | RS | Сербия | |
🇲🇪 | МЕНЯ | Черногория | |||
ZR | Заир | 🇨🇩 | CD | Конго - Киншаса |
Отдельный механизм ( последовательности тегов эмодзи ) используется для региональных флагов, таких как Англия 🏴, Шотландия 🏴, Уэльс 🏴, Техас 🏴. или Калифорния 🏴 Он использует U + 1F3F4 🏴 WAVING BLACK FLAG и символы тега форматирования вместо символов региональных индикаторов. Он основан на регионах ISO 3166-2 с удаленным дефисом и строчными буквами, например GB-ENG → gbeng, оканчивающимся U + E007F CANCEL TAG . Флаг Англии поэтому представлен последовательностью U + 1F3F4 , U + E0067 , U + E0062 , U + E0065 , U + E006E , U + E0067 , U + E007F . В десятой редакции консорциум Unicode рассматривал вместо этого U + 1F3F3 🏳 WAVING WHITE FLAG , но с одиннадцатой и далее он стал черным. Некоторые поставщики предпочитают включать настраиваемые объединяющие последовательности нулевой ширины, которые отображаются только на их платформе, например WhatsApp и их флаг нации беженцев 🏳️🟧⬛️🟧.
Блок Unicode
Подмножество символов региональных индикаторов в таблице кодов Официального консорциума Unicode в прилагаемом буквенно-цифровом приложении (PDF)
|
||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | B | C | D | E | F | |
... | (U + 1F100 – U + 1F1E5 опущены) | |||||||||||||||
U + 1F1Ex | 🇦 | 🇧 | 🇨 | 🇩 | 🇪 | 🇫 | 🇬 | 🇭 | 🇮 | 🇯 | ||||||
U + 1F1Fx | 🇰 | 🇱 | 🇲 | 🇳 | 🇴 | 🇵 | 🇶 | 🇷 | 🇸 | 🇹 | 🇺 | 🇻 | 🇼 | 🇽 | 🇾 | 🇿 |
Примечания
|
Фон
В 2007 году Техническому комитету Unicode был представлен проект предложения по кодированию символов эмодзи , особенно тех, которые широко используются на мобильных телефонах японскими телекоммуникационными компаниями DoCoMo , KDDI и SoftBank . Предложенные символы включали десять национальных флагов: Китая (🇨🇳), Германии (🇩🇪), Испании (🇪🇸), Франции (🇫🇷), Великобритании (🇬🇧), Италии (🇮🇹), Японии (🇯🇵). , Южная Корея (🇰🇷), Россия (🇷🇺) и США (🇺🇸). Некоторые считают, что кодирование этих флагов, но не флагов других стран, наносит ущерб. Одно отклоненное решение заключалось в том, чтобы закодировать десять флагов, но назвать их «СИМВОЛ СОВМЕСТИМОСТИ EMOJI-n» и визуально представить их в Стандарте как «EC n» вместо того, чтобы показывать флаги, которые они представляют. Другое отклоненное решение выделило бы 676 кодовых точек (26 × 26) для каждой возможной двухбуквенной комбинации A – Z. Они будут представлять политические субъекты, основанные на ISO 3166, такие как «FR» для Франции или нДВУ в Интернете ( домены верхнего уровня с кодом страны ), такие как «ЕС» для Европейского Союза.
Было принято решение добавить 26 символов к буквам, используемым для представления региональных индикаторов, которые в парах будут представлять десять национальных флагов и возможные будущие расширения. Согласно Стандарту Юникода «основная цель таких пар [символ регионального индикатора] состоит в том, чтобы обеспечить однозначное двустороннее сопоставление определенных символов, используемых в базовых наборах эмодзи», в частности, десяти национальных флагов: 🇨🇳, 🇩🇪, 🇪🇸, 🇫🇷, 🇬🇧, 🇮🇹, 🇯🇵, 🇰🇷, 🇷🇺 и 🇺🇸.