职友集(www.jobui.com) Lucene Similarity 的排序规则更改了...

阅读更多
开场白:以前职友集(www.jobui.com)的排序方式很原始,直接按Lucene的默认的Similarity排序,不过这样使得用户感受非常不好,留意过我之前写的博客中已经有提到过通过继承Similarity来实现自定义的排序方法。因为职友集是一个全国最大的中文职位搜索引擎,职位搜索有一个特点就是时间相关性,不但要匹配,而且还需要最新的职位排序最前才会有良好的用户感受,同时现在职友集使用了最新的Lucene3.01感觉速度的确比以前的Lucene2.*会快。


然后我们是按关键字最大匹配的方式来定义排序的,用户输入的关键字,只会在用户的标题匹配了都全部匹配了,这些职位才会排序靠前。然后靠前那一些职位再按发布时间倒序。只匹配一个关键字的,会相对于匹配两个关键字的要排序靠后,关键字只出现在职位内容的,那会排到最后,因为用户并不会在意这些相关度较低的职位了。


开始:今天(2010-06-10) 特意在职友集排序规则改变前与后做了一个截图对比一下。


职友集(www.jobui.com) Lucene Similarity 的排序规则更改了..._第1张图片

大家看到了,“产品经理”作为关键字,职位名称只需要包含这两个关键字就可以靠前了。
但是并不是完全匹配的。
经过我们技术与产品部的同事讨论后,认为,应该把完全匹配的职位要全部相对靠前,这样用户体验才会好。所以对排序规则作了修改。



更改后:


职友集(www.jobui.com) Lucene Similarity 的排序规则更改了..._第2张图片


现在修改后,大家可以看到,完全匹配了“产品经理”的职位会全部靠前,当然,这批完全匹配的职位会按发布时间倒序的,同时那些职位职位名称都含有“产品经理”但并不完全匹配的职位会相对靠后一些,如下图,就是全部匹配的“产品经理”与只需要含有“产品经理”的职位的排序分界点了。

职友集(www.jobui.com) Lucene Similarity 的排序规则更改了..._第3张图片

由于写博客的时间较短,难免出现错漏或者问题,欢迎大家转载,但请注明作者与出处。
http://kernaling-wong.iteye.com/blog/689078
  • 职友集(www.jobui.com) Lucene Similarity 的排序规则更改了..._第4张图片
  • 大小: 166.3 KB
  • 职友集(www.jobui.com) Lucene Similarity 的排序规则更改了..._第5张图片
  • 大小: 159.2 KB
  • 职友集(www.jobui.com) Lucene Similarity 的排序规则更改了..._第6张图片
  • 大小: 162.9 KB
  • 查看图片附件

你可能感兴趣的:(职友集(www.jobui.com) Lucene Similarity 的排序规则更改了...)