【原】python中文文本挖掘资料集合

这些网址是我在学习python中文文本挖掘时觉得比较好的网站,记录一下,后期也会不定期添加:
 
1. http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98
非常全的网址,讲了各个库,还有github代码地址
2. http://blog.csdn.net/abcjennifer/article/details/23615947
Rachel Zhang的文章,运用的各种算法,可以测出准确率
3. http://www.ibm.com/developerworks/cn/data/library/bd-natural-language/
利用python、scikit和文本分析来实现行为分析
4. http://developer.51cto.com/art/201507/485276.htm
一个完整的介绍分词,从导入数据集到最后结果
5. http://www.tuicool.com/articles/U3uiiu
一个简单的例子,jieba分词
6. http://scikit-learn.org/stable/modules/feature_extraction.html
官网上对文本分析的介绍
7. http://ju.outofmemory.cn/entry/74958
scikit文本特征提取
8. http://blog.csdn.net/lsldd/article/details/41520953
一个博主写的,简单的分词
9. http://zhuanlan.zhihu.com/textmining-experience/19630762
知乎上的文本分析专栏
10. http://www.clips.ua.ac.be/pages/pattern-en#sentiment
pattern包得用法
 

你可能感兴趣的:(【原】python中文文本挖掘资料集合)