Unicode编码的英文说明说明如下:
Unicode 6.2.0 is a
minor version of the Unicode Standard. This page summarizes the important changes for the Unicode Standard, Version 6.2.0. In the discussion below, Version 6.2.0 may be abbreviated as “Unicode 6.2” or “Version 6.2.”
A. Summary
Version 6.2 of the Unicode Standard is a special release dedicated to the early publication of the newly encoded Turkish lira sign. This version also rolls in various minor corrections for errata and other small updates for the Unicode Character Database. In addition, there are some significant changes to the Unicode algorithms for text segmentation and line breaking, including changes to the line break property to improve line breaking for emoji symbols.
For detailed property changes see Section F. Unicode Character Database Changes.
Two other important Unicode specifications are maintained in synchrony with the Unicode Standard, and have updates for
Version 6.2:
UTS #10, Unicode Collation Algorithm
UTS #46, Unicode IDNA Compatibility Processing
This version of the Unicode Standard is synchronized with ISO/IEC 10646:2012, plus the accelerated publication of a single character: U+20BA TURKISH LIRA SIGN.
编码表地址对应如下:
【0020-007F】 Basic Latin 基本拉丁字母
【00A0-00FF】 Latin-1 Supplement 拉丁字母补充-1
【0100-017F】 Latin Extended-A 拉丁字母扩充-A
【0180-023F】 Latin Extended-B 拉丁字母扩充-B
【0250-02AF】 IPA Extensions 国际音标扩充
【02B0-02EF】 Spacing Modifier Letters 进格修饰字符
【0300-036F】 Combining Diacritical Marks 组合音标附加符号
【0370-03FF】 Greek and Coptic 希腊字母
【0400-04FF】 Cyrillic 西里尔字母
【0500-052F】 Cyrillic Supplement 西里尔字母补充
【0530-058F】 Armenian 亚美尼亚文
【0590-05FF】 Hebrew 希伯来文
【0600-06FF】 Arabic 基本阿拉伯文
【0700-074F】 Syriac 叙利亚文
【0750-077F】 Arabic Supplement 阿拉伯文补充
【0780-07BF】 Thaana 塔纳文
【07C0-07FF】 N’Ko
【0900-097F】 Devanagari 天城体梵文字母
【0980-09FF】 Bengali 孟加拉国文
【0A00-0A7F】 Gurmukhi 古尔穆基文
【0A80-0AFF】 Gujarati 古吉拉特文
【0B00-0B7F】 Oriya 奥里亚文
【0B80-0BFF】 Tamil 泰米尔文
【0C00-0C7F】 Telugu 泰卢固文
【0C80-0CFF】 Kannada 卡纳达文
【0D00-0D7F】 Malayalam 马拉亚拉姆文
【0D80-0DFF】 Sinhala 僧伽罗文
【0E00-0E7F】 Thai 泰文
【0E80-0EFF】 Lao 老挝文;寮国文
【0F00-0FFF】 Tibetan 藏文
【1000-109F】 Myanmar 缅甸文
【10A0-10FF】 Georgian 格鲁吉亚文
【1100-11FF】 Hangul Jamo 谚文字母
【1200-137F】 Ethiopic 埃塞俄比亚文
【1380-139F】 Ethiopic Supplement 埃塞俄比亚文补充
【13A0-13FF】 Cherokee 切罗基文
【1400-167F】 Unified Canadian Aboriginal Syllabics 加拿大土著统一音节文字
【1680-169F】 Ogham 欧甘文
【16A0-16FF】 Runic 北欧古文
【1700-171F】 Tagalog 他加禄文
【1720-173F】 Hanunoo 哈努诺文
【1740-175F】 Buhid 布什德文
【1760-177F】 Tagbanwa 塔格巴努亚文
【1780-17FF】 Khmer 高棉文
【1800-18AF】 Mongolian 蒙古文
【1900-194F】 Limbu 林布文
【1950-197F】 Tai Le 傣哪文;德宏傣文
【1980-19DF】 New Tai Lue 新傣仂文
【19E0-19FF】 Khmer Symbols 高棉符号
【1A00-1A1F】 Buginese 布吉文
【1B00-1B7F】 Balinese 巴利文
【1D00-1D7F】 Phonetic Extensions 音标扩充
【1D80-1DBF】 Phonetic Extensions Supplement 音标扩充补充
【1DC0-1DFF】 Combining Diacritical Marks Supplement 组合音标附加符号
【1E00-1EFF】 Latin Extended Additional 拉丁字母扩充附加
【1F00-1FFF】 Greek Extended 希腊文扩充
【2000-206F】 General Punctuation 一般标点符号
【2070-209F】 Superscripts and Subscripts 下标及上标
【20A0-20CF】 Currency Symbols 货币符号
【20D0-20FF】 Combining Diacritical Marks for Symbols 符号用组合附加符号
【2100-214F】 Letterlike Symbols 似字母符号
【2150-218F】 Number Forms 数字形式
【2190-21FF】 Arrows 箭头符号
【2200-22FF】 Mathematical Operators 数学运算符号
【2300-23FF】 Miscellaneous Technical 混合专门符号
【2400-243F】 Control Pictures 控制图像
【2440-245F】 Optical Character Recognition 光学字符识别
【2460-24FF】 Enclosed Alphanumerics 括号字母数字
【2500-257F】 Box Drawing 制表符
【2580-259F】 Block Elements 区块组件
【25A0-25FF】 Geometric Shapes 几何形状
【2600-26FF】 Miscellaneous Symbols 混合什锦符号
【2700-27BF】 Dingbats 什锦符号
【27C0-27EF】 Miscellaneous Mathematical Symbols-A 混合数学符号-A
【27F0-27FF】 Supplemental Arrows-A 补充性箭头符号-A
【2800-28FF】 Braille Patterns 盲文;盲人点字
【2900-297F】 Supplemental Arrows-B 补充性箭头符号-B
【2980-29FF】 Miscellaneous Mathematical Symbols-B 混合数学符号-B
【2A00-2AFF】 Supplemental Mathematical Operators 补充性数学运算符号
【2B00-2BFF】 Miscellaneous Symbols and Arrows 混合什锦符号和箭头符号
【2C00-2C5F】 Glagolitic 格拉戈尔字母
【2C60-2C7F】 Latin Extended-C 拉丁字母扩充-C
【2C80-2CFF】 Coptic 科普特文
【2D00-2D2F】 Georgian Supplement 格鲁吉亚文补充
【2D30-2D7F】 Tifinagh 提非纳格字母
【2D80-2DDF】 Ethiopic Extended 埃塞俄比亚文扩充
【2E00-2E7F】 Supplemental Punctuation 补充性标点符号
【2E80-2EFF】 CJK Radicals Supplement 中日韩部首补充
【2F00-2FDF】 Kangxi Radicals 康熙部首
【2FF0-2FFF】 Ideographic Description Characters 汉字结构描述字符
【3000-303F】 CJK Symbols and Punctuation 中日韩符号和标点
【3040-309F】 Hiragana 平假名
【30A0-30FF】 Katakana 片假名
【3100-312F】 Bopomofo 注音符号
【3130-318F】 Hangul Compatibility Jamo 谚文兼容字母
【3190-319F】 Kanbun 汉文标注号
【31A0-31BF】 Bopomofo Extended 注音符号扩充
【31C0-31EF】 CJK Strokes 中日韩笔画部件
【31F0-31FF】 Katakana Phonetic Extensions 片假名音标扩充
100.【3200-32FF】 Enclosed CJK Letters and Months 中日韩括号字母及月份
101.【3300-33FF】 CJK Compatibility 中日韩兼容字符
102.【3400-4DBF】 CJK Unified Ideographs Extension A 中日韩统一表意文字扩充A
103.【4DC0-4DFF】 Yijing Hexagram Symbols 易经六十四卦象
104.【4E00-9FFF】 CJK Unified Ideographs 中日韩统一表意文字
105.【A000-A48F】 Yi Syllables 彝文音节
106.【A490-A4CF】 Yi Radicals 彝文字母
107.【A700-A71F】 Modifier Tone Letters 声调符号
108.【A720-A7FF】 Latin Extended-D 拉丁字母扩充-D
109.【A800-A82F】 Syloti Nagri
110.【A840-A87F】 Phags-pa 八思巴字母
111.【AC00-D7AF】 Hangul Syllables 谚文音节
112.【D800-DB7F】 High Surrogates 高半代用区
113.【DB80-DBFF】 High Private Use Surrogates 高半专用代用区
114.【DC00-DFFF】 Low Surrogates 低半代用区
115.【E000-F8FF】 Private Use Area 专用区
116.【F900-FAFF】 CJK Compatibility Ideographs 中日韩兼容表意文字
117.【FB00-FB4F】 Alphabetic Presentation Forms 字母变体显现形式
118.【FB50-FDFF】 Arabic Presentation Forms-A 阿拉伯文变体显现形式-A
119.【FE00-FE0F】 Variation Selectors 字型变换选取器
120.【FE10-FE1F】 Vertical Forms 竖式标点
121.【FE20-FE2F】 Combining HalF】 Marks 组合半角标示
122.【FE30-FE4F】 CJK Compatibility Forms 中日韩相容形式
123.【FE50-FE6F】 Small Form Variants 小写变体
124.【FE70-FEFF】 Arabic Presentation Forms-B 阿拉伯文变体显现形式-B
125.【FF00-FFEF】 Halfwidth and Fullwidth Forms 半角及全角字符
126.【FFF0-FFFF】 Specials 特殊区域
127.【10000-1007F】 Linear B Syllabary 线形文字B音节文字
128.【10080-100FF】 Linear B Ideograms 线形文字B表意文字
129.【10100-1013F】 Aegean Numbers 爱琴数字
130.【10140-1018F】 Ancient Greek Numbers 古希腊数字
131.【10300-1032F】 Old Italic 古意大利文
132.【10330-1034F】 Gothic 哥特文
133.【10380-1039F】 Ugaritic 乌加里特楔形文字
134.【103A0-103DF】 Old Persian 古波斯文
135.【10400-1044F】 Deseret 犹他大学音标
136.【10450-1047F】 Shavian 肃伯纳字母
137.【10480-104AF】 Osmanya
138.【10800-1083F】 Cypriot Syllabary 塞浦路斯音节文字
139.【10900-1091F】 Phoenician 腓尼基字母
140.【10A00-10A5F】 Kharoshthi 佉卢字母
141.【12000-123FF】 Cuneiform 楔形文字
142.【12400-1247F】 Cuneiform Numbers and Punctuation 楔形文字数字及标点
143.【1D000-1D0FF】 Byzantine Musical Symbols 东正教音乐符号
144.【1D100-1D1FF】 Musical Symbols 音乐符号
145.【1D200-1D24F】 Ancient Greek Musical Notation 古希腊音乐谱记号
146.【1D300-1D35F】 Tai Xuan Jing Symbols 太玄经符号
147.【1D360-1D37F】 Counting Rod Numerals 算筹记数式
148.【1D400-1D7FF】 Mathematical Alphanumeric Symbols 数学用字母数字符号
149.【20000-2A6DF】 CJK Unified Ideographs Extension B 中日韩统一表意文字扩充B
150.【2F800-2FA1F】 CJK Compatibility Ideographs Supplement 中日韩兼容表意文字补充
151.【E0000-E007F】 Tags 语言编码卷标
152.【E0100-E01EF】 Variation Selectors Supplement 字型变换选取器补充
153.【FFF80-FFFFF】 Supplementary Private Use Area-A 补充专用区-A
154.【10FF80-10FFFF】 Supplementary Private Use Area-B 补充专用区-B