[导入]汉字正则

识别utf-8编码字符的正则表达式应为   "/[\xf0-\xf7][\x80-\xbf]{3}|[\xe0-\xef][\x80-\xbf]{2}|[\xc2-\xdf][\x80-\xbf]|[\x01-\x7f]/。

据传是因为utf8的汉字编码有1-4个字节组成

bestmost 2009-02-27 14:47 发表评论

文章来源: http://www.phpweblog.net/fuyongjie/archive/2009/02/27/6355.html

你可能感兴趣的:(正则)