和大多数人一样,小弟对各种机器学习和数据挖掘算法都小有兴趣,常用的算法也都知道基本思想,但尝试不多。最近收集了一些算法的实用技巧,待有空时仔细研读。
(1)机器学习那些事 & 机器学习根基
那些事儿:http://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf
根基:http://www.cs.cmu.edu/~tom/pubs/MachineLearning.pdf
(2)SVM支持向量机:
作者:http://www.csie.ntu.edu.tw/~cjlin/
英文版:http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf
中文版:http://blog.sina.com.cn/s/blog_72995dcc0100pflx.html
(3)深度学习神经网络
作者:http://www.iro.umontreal.ca/~bengioy/yoshua_en/index.html
英文版:http://www.iro.umontreal.ca/~bengioy/papers/YB-tricks.pdf
(4)模型选择
英文版:http://eprints.pascal-network.org/archive/00005768/01/guyon-mlss.pdf
(5)贝叶斯网络
英文版:http://as.wiley.com/WileyCDA/WileyTitle/productCd-0470060301.html
(6)朴素贝叶斯
英文版:http://paulgraham.com/better.html
(7)文本分析中的参数估计,以LDA为例
英文版:http://faculty.cs.byu.edu/~ringger/CS601R/papers/Heinrich-GibbsLDA.pdf
(8)吉布森采样
英文版:Gibbs Sampling for the Uninitiated
连接:http://www.umiacs.umd.edu/~resnik/pubs/gibbs.pdf
(9)贝叶斯推理
英文版:Bayesian Inference with Tears: A Tutorial Workbook for Natural Language Researchers
链接:http://www.isi.edu/natural-language/people/bayes-with-tears.pdf
(10)非参贝叶斯
英文版:A Tutorial on Bayesian Nonparametric Models
连接:http://www.cs.princeton.edu/~blei/papers/GershmanBlei2012.pdf
(11)最大熵
英文版:Using Maximum Entropy for Text Classification
连接:http://www.kamalnigam.com/papers/maxent-ijcaiws99.pdf
(12)广告点击率预估
英文版:Ad Click Prediction: a View from the Trenches
连接:http://static.googleusercontent.com/media/research.google.com/en//pubs/archive/41159.pdf
(13)逻辑回归
英文版:Using and Interpreting Logistic Regression: A Guide for Teachers and Students
连接:http://www.sjsu.edu/people/james.lee/courses/JS203/s1/Logistic%20Regression.pdf