自然语言处理(NLP)中的中文分词算法及 Python 实现

中文分词算法是指将一个汉字序列切分成一个一个单独的词,与英文以空格作为天然的分隔符不同,中文字符在语义识别时,需要把数个字符组合成词,才能表达出真正的含义。

分词算法是文本挖掘的基础,通常应用于自然语言处理、搜索引擎、智能推荐等领域。

通过本 Chat,你将学会基于字符串匹配的中文分词算法的原理及 Python 代码实现:

  1. 正向最大匹配法
  2. 逆向最大匹配法
  3. 最少切分

阅读全文: http://gitbook.cn/gitchat/activity/5b84c1e724d25b4e69266903

您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。

FtooAtPSkEJwnW-9xkCLqSTRpBKX

你可能感兴趣的:(自然语言处理(NLP)中的中文分词算法及 Python 实现)