中文汉字的正则字符编码范围


中文编码范围,中文汉字的正则也许用的着。

双字节字符编码范围:

1. GBK (GB2312/GB18030)

\x00-\xff GBK双字节编码范围
\x20-\x7f ASCII
\xa1-\xff 中文gb2312
\x80-\xff 中文 gbk

2. UTF-8 (Unicode)

\u4e00-\u9fa5 (中文)
\x3130-\x318F (韩文)
\xAC00-\xD7A3 (韩文) 
\u0800-\u4e00 (日文)

你可能感兴趣的:(013java)