实验进展 2009年5月21日

 

今天使用了ranking svm模型重新跑了下打分后的结果,性能得到了小幅度的提升!

其中,在bookmark表和bibtex表上的性能都有提升。

看来机器学习和模式识别中建立那么复杂的模型还是很有用的。

本来只想使用打分,然后排序,但这个比较弱,没什么学术价值。另外,打分时,我分两步进行了打分,关于这两个分数这么融合,没有很好的想法,如果只是简单地相加就太简单了,所以想到了引入ranking svm模型来整合这两个分数。实验结果证明,还是比较有效的。虽然有点杀鸡用牛刀的感觉。

另外,尝试了研究 用户 和tag之间的关系。

希望通过计算 用户和tag之间的互信息,来了解,是否有些用户总是使用那么几个标签。另外,希望通过计算tag在用户的分布的熵,来了解这两者之间的关系。熵是用来衡量不确定程度的,如果对于某个用户,其用的tag的熵很小,那么其越倾向于是用那么简单的几个tag.但观察了下,好像是帮助不大。如果以后有时间再来挖掘下。

=========================================================

补上之前的实验进展

2009年5月19日

使用了打分模型,结果得到了非常大的提升!超过了baseline.

2009年5月18日

在打分模型的基础上,加入了资源信息,结果提升很大,超过了上届第一名。

你可能感兴趣的:(实验进展 2009年5月21日)