pymmseg windows下中文分词, 下载附件, 直接 import 目录就行了。
#coding=utf-8
from pymmseg import mmseg
mmseg.dict_load_defaults()
text = '今天的天气真好啊,我们一起出去玩一下吧'
algor = mmseg.Algorithm(text)
word = []
for tok in algor:
word.append(tok.text)
print ' '.join(word).decode('utf8').encode('gb2312')
命令行cmd下的效果:
G:\git\Graduation-Design\src\web>aa.py
今天 的 天气真好 啊 , 我们 一起 出去 玩 一下 吧
====================================
之前下载了一个 inpout32.dll 文件放到了 c:/windows/system32/目录, 不知这是不是必须的。