Libsvm和Liblinear是台湾大学Chih-Jen Lin博士开发的


广告点击率预测 [离线部分] - quweiprotoss的日志 - 网易博客
http://quweiprotoss.blog.163.com/blog/static/4088288320144810567471?utm_source=tuicool&utm_medium=referral
Training

     已经说了是要一天做完pCTR,那显然自己写就有点不现实了,下载一下liblinear,然后就可以开始训练了,当然一般点击率都很低的,Feeds,搜索广告高一些x%,展示广告一般就0.x%,我做的产品点击率就低的没脸提了。按一切从简一切从暴的原则,正例全保留,负例按正例的倍数抽吧。

Liblinear的使用脚本百事通
http://www.csdn123.com/html/mycsdn20140110/1b/1b97de7c9ef9cc44570e58d1abbf68ab.html

以下为一位网友采用liblinear进行数据分类的实验性能说明“
”今天试用了以下liblinear,速度很快(快到我没有想到),
我的实验数据:
训练集:21504 * 1500(1500是样本的数量,21504是维度)
测试集:21504 * 2985
速度用秒来衡量,20次实验总共不到2分钟。


Libsvm和Liblinear的使用经验谈 - sunlylorn的专栏 - 博客频道 - CSDN.NET
http://blog.csdn.net/sunlylorn/article/details/7885586
Libsvm和Liblinear都是国立台湾大学的Chih-Jen Lin博士开发的,Libsvm主要是用来进行非线性svm 分类器的生成,提出有一段时间了,而Liblinear则是去年才创建的,主要是应对large-scale的data classification,因为linear分类器的训练比非线性分类器的训练计算复杂度要低很多,时间也少很多,而且在large scale data上的性能和非线性的分类器性能相当,所以Liblinear是针对大数据而生的。

两者都是一个跨平台的通用工具库,支持windows/linux/mac os,代码本身是c++写的,同时也有matlab,Python,java,c/c++扩展接口,方便不同语言环境使用,可以说是科研和企业人员的首选!像我这样在学校的一般用matlab/c++,而我同学在百度则主要用的是python/c++,所以只是各自侧重不一样,但所使用的核心还是其svm库。

你可能感兴趣的:(Libsvm和Liblinear是台湾大学Chih-Jen Lin博士开发的)