自然语言处理之HMM

使用HMM进行分词
根据语料计算参数。

我是中国人。
S S B M E S

训练过程:
先计算开始概率,开始词是我标注是S的概率为100%,我是B,M,E的概率为0,并且开头是S的概率是100%,开头是B,M,E的概率为0,然后计算”是”是S的概率为100%。“是”是B,M,S的概率为0,计算前面是S,后面是S的概率是100%。根据上面的计算“是”是s,b,m,e的概率是多少。
预测过程:

我爱中国。

根据存储的概率使用维特比算法计算出最大概率路径。

你可能感兴趣的:(NLP,HMM)