python中文按拼音排序

bash中要对中文排序,只需:
LC_COLLATE="zh_CN.UTF8" sort /tmp/a就可以。
同样的,python中只需:
import locale
locale.setlocale('LC_COLLATE', 'zh_CN.UTF8')
a = ['中国人', '啊', '你好', '台湾人']
b = sorted(a, cmp = locale.strcoll)
locale本身不是线程安全的,根据下面这篇讨论,可以使用contextmanager解决。

http://stackoverflow.com/questions/11121636/sorting-list-of-string-with-specific-locale-in-python

有的服务器不能locale不能设置成功,需要安装语言包:

sudo apt-get install language-pack-zh*

你可能感兴趣的:(python中文按拼音排序)