Python pypinyin、jieba模块

Python pypinyin、jieba模块

今天学习了两个有用的模块,都是跟文字有关的:pypinyin,jieba

  • pypinyin是将汉字转换成拼音的
  • jieba实现了中文的分词

pypinyin 的官方说明文档位置:http://pypinyin.readthedocs.org/en/master/

jieba的官方说明文档位置:https://github.com/fxsjy/jieba/blob/master/README.md

两个官方文档内容不多,看起来也很方便,本人就不在博客里叨述了

自己试了一下pypinyin的函数:

import pypinyin

pinyinlist = pypinyin.pinyin("谭维维", style=pypinyin.NORMAL)
print(pinyinlist) pinyinlist = pypinyin.pinyin("落", heteronym=True) print(pinyinlist) pinyinlist = pypinyin.pinyin("四是四十是十", style=pypinyin.TONE) print(pinyinlist) 

输出如下:

[['tan'], ['wei'], ['wei']]
[['là', 'luò', 'lào']]
[['sì'], ['shì'], ['sì'], ['shí'], ['shì'], ['shí']]

使用起来还是非常方便的

自己有一段时间没有更新博客了,自己毕业了,毕业期间好多事情需要弄,就没有继续撸代码,现在继续撸起来,每天进步一点点,日拱一卒,与各位共同进步!

你可能感兴趣的:(python,文字)