[\u4E00-\u9FA5]+

示例:

re.compile(ur"([\u4E00-\u9FA5]+)")

至少匹配一个汉字的写法。
这两个unicode值正好是Unicode表中的汉字的头和尾
"[]"代表里边的值出现一个就可以,后边的“+”代表至少出现1次,合起来即至少匹配一个汉字。


要选一种顺手的模式来读源码

你可能感兴趣的:([\u4E00-\u9FA5]+)