正则字符集大全

正则式\p{名字}
正则字符集大全1,微软给出的,注意不全,补充在下面,但仍然不全,还有几个小区间找不到:

字符区间 中文名
0000-007F 是基本拉丁
0080-00FF 是拉丁补充
0100-017F 是拉丁扩展1
0180-024F 是拉丁扩展2
0250-02AF 是音标扩展
02B0-02FF 是空格修改器字母
0300-036F 是组合区分标记
0370-03FF 是希腊/是希腊和科普特
0400-04FF 是西里尔
0500-052F 是西里尔补充
0530-058F 是亚美尼亚
0590-05FF 是希伯来语
0600-06FF 是阿拉伯
0700-074F 是叙利亚
0780-07BF 是塔纳
0900-097F 是梵文
0980-09FF 是孟加拉语
0A00-0A7F 是锡克教文
0A80-0AFF 是吉吉拉特
0B00-0B7F 是奥利亚
0B80-0BFF 是泰米尔
0C00-0C7F 是泰卢固
0C80-0CFF 是加拿大
0D00-0D7F 是马拉亚兰
0D80-0DFF 是锡兰文
0E00-0E7F 是泰国
0E80-0EFF 是老挝
0F00-0FFF 是西藏
1000-109F 是缅甸
10A0-10FF 是乔治亚
1100-11FF 是朝鲜文
1200-137F 是埃塞俄比亚
13A0-13FF 是切诺基
1400-167F 是统一加拿大土著语音节
1680-169F 是欧甘
16A0-16FF 是北欧
1700-171F 是菲律宾
1720-173F 是哈奴奴
1740-175F 是布迪文
1760-177F 是泰格班瓦
1780-17FF 是柬埔寨
1800-18AF 是蒙古
1900-194F 是林布
1950-197F 是泰勒
19E0-19FF 是柬埔寨符号
1D00-1D7F 是语音扩展
1E00-1EFF 是拉丁附加扩展
1F00-1FFF 是希腊扩展
2000-206F 是一般标点
2070-209F 是上下标
20A0-20CF 是货币符号
20D0-20FF 是符号组合区分标记/是符号组合标记
2100-214F 是字母类符号
2150-218F 是数字形式
2190-21FF 是箭头
2200-22FF 是数学运算符
2300-23FF 是杂项工业技术
2400-243F 是控制图片
2440-245F 是可选特征识别
2460-24FF 是闭式字母数字
2500-257F 是盒画
2580-259F 是块元素
25A0-25FF 是几何形状
2600-26FF 是杂项符号
2700-27BF 是印刷
27C0-27EF 是杂项数学符1
27F0-27FF 是追加箭头1
2800-28FF 是盲文模式
2900-297F 是追加箭头2
2980-29FF 是杂项数学符2
2A00-2AFF 是补充数学操作符
2B00-2BFF 是杂项符号箭头
2E80-2EFF 是中日韩部首补充
2F00-2FDF 是康熙部首
2FF0-2FFF 是表意描述字符
3000-303F 是中日韩符号标点
3040-309F 是平假名
30A0-30FF 是片假名
3100-312F 是汉语拼音
3130-318F 是兼容朝鲜文
3190-319F 是象形
31A0-31BF 是汉语拼音扩展
31F0-31FF 是平假名音标扩展
3200-32FF 是闭式中日韩字母和月份
3300-33FF 是兼容中日韩
3400-4DBF 是中日韩统一象形文字扩展1
4DC0-4DFF 是易经六十四卦符号
4E00-9FFF 是中日韩统一象形文字
A000-A48F 是彝文音节
A490-A4CF 是彝文部首
AC00-D7AF 是韩文音节
D800-DB7F 是高替代
DB80-DBFF 是高自用替代
DC00-DFFF 是低替代
E000-F8FF 是自用/是自用区域
F900-FAFF 是兼容中日韩象形文字
FB00-FB4F 是字母表示
FB50-FDFF 是阿拉伯表示1
FE00-FE0F 是变量选择器
FE20-FE2F 是组合半标记
FE30-FE4F 是兼容中日韩形式
FE50-FE6F 是小型变体
FE70-FEFF 是阿拉伯表示2
FF00-FFEF 是半或全宽形式
FFF0-FFFF 是特殊

补充在此,还缺少几个:

字符区间 中英文
0750-077F 阿拉伯文补充(ArabicSupplement)
0780-07BF 马尔代夫语(Thaana)
07C0-07FF 西非书面语言
--------- 分界
0800-085F 阿维斯塔语及巴列维语(AvestanandPahlavi)
0860-087F 曼达语(Mandaic)
0880-08AF 撒马利亚语(Samaritan)
-------- 分界
08b0-08fF **缺少**
1380-139F 埃塞俄比亚语补充(EthiopicSupplement)
---- 分界
18B0-18FF 可汗语(Cham)
----- 分界
1980-19DF 新泰语(NewTaiLue)
---- 分界
1A00-1A1F 布吉语(Buginese)
1A20-1A5F 巴达克(Batak)
1a60-1a7f *缺少*
1A80-1AEF 兰纳(Lanna)
1af0-1aff *缺少*
1B00-1B7F 巴厘语(Balinese)
1B80-1BB0 巽他语(Sundanese)
1bb1-1bbf *缺少*
1BC0-1BFF 帕苗语(PahawhHmong)
1C00-1C4F 雷布查语(Lepcha)
1C50-1C7F 桑塔利(OlChiki)
1C80-1CDF 曼尼普尔语(Meithei/Manipuri)
1Ce0-1Cff *缺少*
----- 分界
1D80-1DBF 语音学扩展补充
1DC0-1DFF 结合用读音符号补充(CombiningDiacriticsMarksSupplement)
---- 分界
2C00-2C5F 格拉哥里字母(Glagolitic)
2C60-2C7F 拉丁文扩展3(LatinExtended-C)
2C80-2CFF 古埃及语(Coptic)
2D00-2D2F 格鲁吉亚语补充(GeorgianSupplement)
2D30-2D7F 提非纳文(Tifinagh)
2D80-2DDF 埃塞俄比亚语扩展(EthiopicExtended)
2E00-2E7F 追加标点(SupplementalPunctuation)
---- 分界
2Fe0-2Fef 这一部分也是部首(*缺少*)
---- 分界
31C0-31EF 中日韩笔画(CJKStrokes)
---- 分界
A500-A61F 瓦伊(Vai)
A660-A6FF 统一加拿大土著语音节补充(UnifiedCanadianAboriginalSyllabicsSupplement)
A700-A71F 声调修饰字母(ModifierToneLetters)
A720-A7FF 拉丁文扩展4(LatinExtended-D)
A800-A82F 赛诺提(SylotiNagri)
A840-A87F 八思巴字(Phags-pa)
A880-A8DF 索拉什拉(Saurashtra)
A900-A97F 爪哇语(Javanese)
A980-A9DF 查克马(Chakma)
AA00-AA3F 瓦朗什提(VarangKshiti)
AA40-AA6F 索朗彭(SorangSompeng)
AA80-AADF 新瓦里(Newari)
AB00-AB5F 越泰语
AB80-ABA0 克耶文(KayahLi)
aba1-abff (*缺少*)
----- 分界

你可能感兴趣的:(中文编程,分享,字符集,正则,正则式,字符集,微软,中文名)