Плоскость (Юникод)
В стандарте Юникод плоскость — непрерывный диапазон из 65 536 (216) кодовых позиций. Существует 17 плоскостей, обозначенных числами от 0 до 16, что соответствует возможным значениям 00—1016 первым двум шестнадцатеричным цифрам в шестизначном формате номера кодовой позиции (U+hhhhhh). Последняя кодовая позиция в Юникоде — последняя кодовая позиция в плоскости 16, U+10FFFF. Плоскость 0 называется Основная многоязычная плоскость (англ. Basic Multilingual Plane, BMP), которая содержит наиболее часто используемые символы. Остальные плоскости (1—16) называются «дополнительными». В версии Юникода 13.0 задействованы кодовые позиции семи плоскостей, при этом две из них предназначены для частного использования.
Ограничение в 17 плоскостей обусловлено кодировкой UTF-16, в которой могли быть закодированы 220 кодовых позиций (16 плоскостей) и BMP. Кодировка UTF-8 была разработана с гораздо большим лимитом в 231 (2 147 483 648) кодовых позиций (32 768 плоскостей) и могла задействовать 221 (2 097 152) кодовых позиций (32 плоскости) даже при лимите 4 байта.
Плоскости Юникода:
- Плоскость 0 (0000—FFFF): Основная многоязычная плоскость (англ. Basic Multilingual Plane, BMP)
- Плоскость 1 (10000—1FFFF): Дополнительная многоязычная плоскость (англ. Supplementary Multilingual Plane, SMP)
- Плоскость 2 (20000—2FFFF): Дополнительная идеографическая плоскость (англ. Supplementary Ideographic Plane, SIP)
- Плоскость 3 (30000—3FFFF): Третичная идеографическая плоскость (англ. Tertiary Ideographic Plane, TIP)
- Плоскости 4—13 (40000—DFFFF) не используются
- Плоскость 14 (E0000—EFFFF): Специализированная дополнительная плоскость (англ. Supplementary Special-purpose Plane, SSP)
- Плоскость 15 (F0000—FFFFF) Дополнительная область для частного использования — A (англ. Supplementary Private Use Area-A, SPUA-A)
- Плоскость 16 (100000—10FFFF) Дополнительная область для частного использования — B (англ. Supplementary Private Use Area-B, SPUA-B)
Основная многоязычная плоскость
Основная многоязычная плоскостьПлоскость 0 (Основная многоязычная плоскость, англ. Basic Multilingual Plane, BMP) отведена для символов практически всех современных письменностей и большого числа специальных символов. Большая часть таблицы занята китайско-японскими иероглифами и своеобразными корейскими буквами.
В Юникоде 13.0 в этой плоскости представлены следующие блоки:
Дополнительная многоязычная плоскость
Плоскость 1 (Дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена преимущественно для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.
В Юникоде 13.0 в этой плоскости представлены следующие наборы символов:
Дополнительная идеографическая плоскость
Плоскость 2 (Дополнительная идеографическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.
В Юникоде 13.0 в этой плоскости представлены следующие наборы иероглифов:
- Унифицированные идеограммы ККЯ — расширение B (20000—2A6DF)
- Унифицированные идеограммы ККЯ — расширение C (2A700—2B73F)
- Унифицированные идеограммы ККЯ — расширение D (2B740—2B81F)
- Унифицированные идеограммы ККЯ — расширение E (2B820—2CEAF)
- Унифицированные идеограммы ККЯ — расширение F (2CEB0—2EBEF)
- Дополнение к совместимым иероглифам ККЯ (2F800—2FA1F)
Третичная идеографическая плоскость
Плоскость 3 (Третичная идеографическая плоскость, англ. Tertiary Ideographic Plane, TIP) содержит редко используемые китайские иероглифы, в неё также предполагается внести исторические формы китайского письма.
Третичная идеографическая плоскость разделена на следующие диапазоны:
- Унифицированные идеограммы ККЯ — расширение G (30000—3134F) — дополнительные редко используемые идеограммы китайского письма;
- Чжуаньшу (31400—342FF) — иероглифы в стиле «малая печать» (сяочжуань, 小篆) и «большая печать» (дачжуань, 大篆);
- Цзягувэнь (34400—35BFF) — древнейшие китайские иероглифы эпохи Шан (цзягувэнь, 甲骨文), встречающиеся в гадательных надписях на панцирях, черепах и костях животных
В будущем также предполагается включить иероглифы эпох Шан и Чжоу (цзиньвэнь, 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах, и наборы иероглифов Периода Сражающихся царств.
Специализированная дополнительная плоскость
Плоскость 14 (Специализированная дополнительная плоскость, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению.
В Юникоде 13.0 в этой плоскости представлены следующие блоки:
- Тэги (E0000—E007F)
- Дополнение к вариантным селекторам (E0100—E01EF)
Области для частного использования
Некоторые диапазоны Юникода отведены для частного использования и экспериментов. Они включают:
- Частную область в Базовой многоязыковой плоскости (E000—F8FF)
- Дополнительные плоскости 15 (F0000—U+FFFFF) и 16 (100000—10FFFF)