使用cjieba(结巴分词库)实现php扩展中文分词-支持php5, php7

编译安装

git clone https://github.com/jonnywang/jz.git  (php7)
git clone https://github.com/jonnywang/phpjieba.git (php5)
cd jz/cjieba
make
cd ..
phpize
./configure --enable-jieba
make
make install
配置php.ini
extension=jz.so 
jz.enable_jieba=1
jz.dict_path=/Users/xingqiba/data/softs/jz/cjieba/dict    #指向jz库dict目录

使用

效果

Array
(
    [0] => 小明
    [1] => 硕士
    [2] => 毕业
    [3] => 于
    [4] => 中国
    [5] => 科学
    [6] => 学院
    [7] => 科学院
    [8] => 中国科学院
    [9] => 计算
    [10] => 计算所
    [11] => ,
    [12] => 后
    [13] => 在
    [14] => 日本
    [15] => 京都
    [16] => 大学
    [17] => 日本京都大学
    [18] => 深造
)

Array
(
    [0] => 计算所
    [1] => 小明
    [2] => 京都大学
    [3] => 深造
    [4] => 硕士
    [5] => 中国科学院
)

你可能感兴趣的:(php,分词,jieba分词)