python---jiebal库

python—jieba库的学习 (计算机2级教材的学习笔记)
1.jieba库
(1)安装 :>pip install jieba
(2)概述:它的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比较,通过图和动态规划方法找到最大概率的词组。另,jieba库还提供增加自定义中文单词的功能
注:英文不存在分词问题
(3)jieba库支持3种模式,全模式,精准模式,搜索引擎模式
(4)jieba.lcut(s) 精准模式,返回列表
jieba.lcut(s,cut_all=True) 全模式,返回列表,冗余最大
jieba.lcut_for_search(s) 搜索引擎模式,更倾向于寻找短词语
jieba.add_word(w) 向分词词典增加新词w

python---jiebal库_第1张图片

import jieba
jieba.lcut('全国计算机等级考试python科目')

Out: ['全国', '计算机', '等级', '考试', 'python', '科目']

python---jiebal库_第2张图片

import jieba
jieba.lcut('全国计算机等级考试python科目',cut_all=True)

Out: ['全国', '国计', '计算', '计算机', '算机', '等级', '考试', 'python', '科目']

python---jiebal库_第3张图片


import jieba
jieba.lcut_for_search('全国计算机等级考试python科目')

Out: ['全国', '计算', '算机', '计算机', '等级', '考试', 'python', '科目']

python---jiebal库_第4张图片
python---jiebal库_第5张图片

import jieba
jieba.add_word('python科目')
jieba.lcut('全国计算机等级考试python科目')

Out: ['全国', '计算机', '等级', '考试', 'python科目']

#2019年版教育部考试中心python二级教程的笔记

你可能感兴趣的:(#,模块和函数)