NLP

近期有同学问我有哪些较好的nlp工具。
之前我们都知道中科院的ictclas,能够实现分词、词性标注功能,而且最新版的还增加了几个篇章级的功能,如新词识别,关键词抽取等,在接口方面ictclas有java, c++, python版本。 
另外,从去年开始我一直在用哈工大的ltp,它的基础性功能比ictclas要丰富一些,除了分词,还有实体识别,句法分析,语义角色标注等,在上下文补充的情况下,效果甚至要优于ictclas。也提供了java,c++,python的接口,而且它还提供云服务,免除本地安装配置环节,但是受限于网速,执行较慢。今天研究了如何在本
地安装Python版的ltp(即pyltp),有兴趣的同学,特别是做与命名实体有关的同学,可以参考一下 http://blog.csdn.net/laoyaotask/article/details/45312905

 

word2013 论文引用参考文献

http://blog.csdn.net/zhaizu/article/details/21092885

 

说到 Deep learning, 可以看看这个最新的中文综述, http://www.ccf.org.cn/resources/1190201776262/2015/03/12/2.pdf 2012 博 郭喜跃(279071569) 16:06:44  非常感谢涂老师 ! 2012级-硕-唐永力<[email protected]> 16:06:47  2013 硕 袁杰(410180422) 16:06:57  2012 博 郭喜跃(279071569) 16:07:35  我在配Theano 总出错 涂新辉(767353) 16:08:59  手把手教你怎么搞 http://deeplearning.net/tutorial/contents.html 涂新辉(767353) 16:10:07   @郭喜跃    一定要在Ubuntu 下搞,不要用windows 涂新辉(767353) 16:12:14  中文的资料不是很多,这个相当不错 http://ufldl.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B

 

 

机器学习日报 http://ml.memect.com/

 

 

 

 

发一个论文给安军辉及其它做类似工作的同学参考: AAAI 2015 最佳论文候选:O网页链接 根据 twitter 的follow 网络关系,预测每个用户的6种基本信息: 性别, 年龄, 种族,教育水平以及收入)训练的是回归模型,但用的时候是当成分类器用,令人惊讶的是,这样效果并不比直接训练一个分类器效果差。
涂新辉(767353) 16:24:34
 

你可能感兴趣的:(nl)