python: 中文分词器pymmseg的编译安装

在使用libsvm的时候 , 缺少各种依赖,首先是libsvm.dll 自带的是32位,只好找64的,在http://www.lfd.uci.edu/~gohlke/pythonlibs/#libsvm下载了 64位的dll , 然后又缺少了libiomp5md.dll 在这个http://cn.dll-files.com/libiomp5md.dll.html下载了, 在运行train.py 的时候,仍然报错, 又提示mmseg.dll 又不兼容了,各种

WindowsError: [Error 193]
WindowsError: [Error 126]

这样的错误,接着又安装尝试

pip install pymmseg 或者
easy_install pymmseg

也是报错啊,也是dll的问题,神烦啊,安装了VS2013 还有这么多不兼容– 然后就在网上查找资料,这篇文章挺不错的,转载过来记录一下python中文分词器pymmseg的安装实录 :

64位win7下pymmseg安装过程:
1.pymmseg的项目下载地址是:
https://code.google.com/p/pymmseg-cpp/downloads/list,如果下载不成功,文末有我已经编译好的连接。
2.选择下载源码包,自己编译,省的出现不兼容的情况。我选择的是pymmseg-cpp-src-1.0.2.tar.gz , 随便目录解压。
3.下面是编译生成dll 的过程,通用;我使用vs带的编译器,在vs开始菜单里找到"Visual Studio Tools"/"VS 2013 x64 本机工具命令提示",这个命令行窗口启动时会自动配好编译器和连接器的环境变量,可以直接使用cl,link等命令了。(64位的机器要用64位的编译器编译,否则32位编译器编译生成的dll,在64位系统中加载会出问题。同理32位的选32的命令窗口)
4.在上一步打开的cmd窗口,切换到pymmseg 的目录下,接着进入子目录mmseg-cpp , 该目录下有一个build.py 执行即可

python build.py

下面是运行截图

5.完成了上一步之后,这时将pymmseg-cpp的整个目录copy到$PYTHON_HOME/Lib/site-packages目录下,并重命名为pymmseg。即可~~~

测试程序:

#-*- coding:utf-8 -*-
from pymmseg import mmseg
mmseg.dict_load_defaults()
text = '妈妈问我为什么跪着看球'
algor = mmseg.Algorithm(text)
for tok in algor:
    print tok.text

结果如下:

妈妈
问我
为什么
跪着
看
球

大概就是这样了,哎心塞,附一个编译好的吧
还有缺少各种dll的时候,可以留个言,我瞅瞅有木有。。
附录: pymmseg

你可能感兴趣的:(python,pymmseg)