Deep Learning 在中文分词和词性标注任务中的应用


开源软件包 SENNAword2vec 中都用到了词向量(distributed word representation),当时我就在想,对于我们的中文,是不是也类似地有字向量(
distributed character representation)的概念呢?

最近恰好读到复旦大学郑骁庆博士等人的文章 [1]《Deep Learning for Chinese Word Segmentation and POS tagging》。这篇文章利用文 [3] 作者提出的神经网络框架,针对中文分词和词性标注任务,给出了一种基于字向量的 perceptron-style 算法,该算法的亮点是受文 [4] 启发在训练部分用了一种新的思路,而不是采用传统的 maximum log-likelihood 方法,极大地降低了算法复杂度,且非常容易实现。数值实验表明,该算法的 performance 也还不错。

本博客是读完文 [1] 后的一则笔记,内容以翻译为主,同时也穿插了一些注记,供感兴趣的读者参考。
 

Deep Learning 在中文分词和词性标注任务中的应用_第1张图片


Deep Learning 在中文分词和词性标注任务中的应用_第2张图片

Deep Learning 在中文分词和词性标注任务中的应用_第3张图片Deep Learning 在中文分词和词性标注任务中的应用_第4张图片Deep Learning 在中文分词和词性标注任务中的应用_第5张图片Deep Learning 在中文分词和词性标注任务中的应用_第6张图片Deep Learning 在中文分词和词性标注任务中的应用_第7张图片Deep Learning 在中文分词和词性标注任务中的应用_第8张图片Deep Learning 在中文分词和词性标注任务中的应用_第9张图片Deep Learning 在中文分词和词性标注任务中的应用_第10张图片Deep Learning 在中文分词和词性标注任务中的应用_第11张图片Deep Learning 在中文分词和词性标注任务中的应用_第12张图片Deep Learning 在中文分词和词性标注任务中的应用_第13张图片Deep Learning 在中文分词和词性标注任务中的应用_第14张图片Deep Learning 在中文分词和词性标注任务中的应用_第15张图片Deep Learning 在中文分词和词性标注任务中的应用_第16张图片Deep Learning 在中文分词和词性标注任务中的应用_第17张图片


Deep Learning 在中文分词和词性标注任务中的应用_第18张图片Deep Learning 在中文分词和词性标注任务中的应用_第19张图片


若需要本文完整的 PDF 文档,请点击《Deep Learning 在中文分词和词性标注任务中的应用》进行下载!

 

作者: peghoty 

出处: http://blog.csdn.net/itplus/article/details/13616045

欢迎转载/分享, 但请务必声明文章出处.

你可能感兴趣的:(中文分词)