bash中要对中文排序,只需:
LC_COLLATE="zh_CN.UTF8" sort /tmp/a就可以。
同样的,python中只需:
import locale
locale.setlocale('LC_COLLATE', 'zh_CN.UTF8')
a = ['中国人', '啊', '你好', '台湾人']
b = sorted(a, cmp = locale.strcoll)
locale本身不是线程安全的,根据下面这篇讨论,可以使用contextmanager解决。
http://stackoverflow.com/questions/11121636/sorting-list-of-string-with-specific-locale-in-python
有的服务器不能locale不能设置成功,需要安装语言包:
sudo apt-get install language-pack-zh*