对于没有使用过全文检索的,我更愿意推荐solr

圈子里有一位热心朋友发了个“Lucene学习者应该了解的全文检索的基本原理”,暂且不论是否宣传自己博客或者其他目的。

没有使用过全文检索的,基于solr能很快搭建自己的搜索,大致学习过程是如何安装搭建,然后就是学习如何解析xml(solr wiki上支持很多语言),一般也就花费1-2个小时最多了,快的么半小时搞定。这些内容网上一搜一大堆。

Lucene学习者无非几种情况:兴趣尝试学习,工作需要,深入研究。

只是搭个小型搜索(一般400-500万搜索),能搜到就可以的,那么solr可以很好的满足你。当然它也适合大中型网站(你可以看看wiki上应用它的网站)

当你觉得它不适合时,确实有条件深入,也有必要深入的,那么再深入,了解几个关键词有助于看代码来了解其设计和算法,写自己的搜索或者直接去看其他搜索,比如Sphinx。

我不排斥多知道点东西,只是花了满多时间学了用不到的东西,那就太浪费了。任何学习都需要时间,而每个人时间有限,所以我希望能节约大家点时间,腾出更多时间看点自己感兴趣的,多陪陪家人朋友。

我不是圣人,也没什么资格说教,只是说些自己想说得。

你可能感兴趣的:(算法,xml,Solr,Lucene,全文检索)