利用 word2vec 训练的字向量进行中文分词




        
       最近针对之前发表的一篇博文《Deep Learning 在中文分词和词性标注任务中的应用》中的算法做了一个实现,感觉效果还不错。本文主要是将我在程序实现过程中的一些数学细节整理出来,借此优化一下自己的代码,也希望为对此感兴趣的朋友提供点参考。文中重点介绍训练算法中的模型参数计算,以及 Viterbi 解码算法。



利用 word2vec 训练的字向量进行中文分词_第1张图片 利用 word2vec 训练的字向量进行中文分词_第2张图片 利用 word2vec 训练的字向量进行中文分词_第3张图片 利用 word2vec 训练的字向量进行中文分词_第4张图片 利用 word2vec 训练的字向量进行中文分词_第5张图片 利用 word2vec 训练的字向量进行中文分词_第6张图片 利用 word2vec 训练的字向量进行中文分词_第7张图片 利用 word2vec 训练的字向量进行中文分词_第8张图片 利用 word2vec 训练的字向量进行中文分词_第9张图片 利用 word2vec 训练的字向量进行中文分词_第10张图片

相关链接
《Deep Learning 在中文分词和词性标注任务中的应用》
《Deep Learning for Chinese Word Segmentation and POS tagging》
《UFLDL 教程学习笔记(一)神经网络》
《HMM 自学教程(六)维特比算法》
《为什么我们喜欢用 sigmoid 这类 S 型非线性变换?》

作者: peghoty 

出处: http://blog.csdn.net/itplus/article/details/17122431

欢迎转载/分享, 但请务必声明文章出处.


你可能感兴趣的:(深度学习,语言模型)