python学习笔记(一)jieba模块初探

环境说明:windows 7,python27,jieba VERSION 0.38,pycharm2016.1

1.简介:

  支持中文分词,关键字提取,词性标注,自己管理词库等

2.安装:

方法一:开始->搜索cmd->cd到pip.exe目录->输入命令pip install jieba

3.代码片段:

import jieba
seg = jieba.cut('有关青春萌动',True
/False)#分词,True/False  全模式/精确模式

seg = jieba.cut_for_search('有关青春萌动',True)#分词,搜索引擎模式

#seg 是迭代器,可通过list(seg)将其转换为列表



#关键词提取(import jieba.analyse)(sentence,关键词数目)
import jieba.analyse
seg  = jieba.analyse.extract_tags('有关青春萌动',12)
print ' '.join(seg)


#词性标注

# import jieba.posseg as pseg
words = pseg.cut("我爱北京天安门")
for w in words:

   print w.word,w.flag


你可能感兴趣的:(python学习笔记(一)jieba模块初探)