Lucene学习一

Lucene学习一
最近要用到全文检索技术。
这个Lucene是个在java界有着很高声誉的全文检索包。
通过学习,自己对它算是有个初步了解。所以写下心得与经验跟朋友们分享。
对于整个网站的结构我说下我的看法
数据库+前端技术+后台处理技术。
上面的这些我就不说了。用来用去就是那几个,你觉得那个用的顺手就行了。

搜索引擎技术呢,我觉得要点是:
1。把我们分散的数据资源整合起来-----对应于Lucene的Index也就是索引的意思。
      我们把数据库的数据,按照自己的方式进行索引,关于索引的技术可以上网查看。这些索引的数据结构是可以自己定义的,这样方便查询。
2。搜索技术,因为我们的资源太分散了,就拿数据里面的资源来说吧,每个表都不同,里面的字段都不同,如果单纯采用数据库来做的话,你可能要写很多个api进行搜索。并对搜索结果进行出里,这样我们就要自己做很多事情。这么麻烦的话,我们何不把这些数据库里面的数据进行索呢,把我们需要的数据,归类,整理,然后保存到索引中,虽然这样会增加磁盘的容量,但我觉得这应该就不是问题。
      对于搜索技术,我们这里又要涉及到关于分词的技术,因为我们中文不同洋文,对分词技术的要求比较高。在这里,我也只是略微看了下Lucene的理论,具体实现,我也很模糊。如果分词分的好,对于搜索精度是有很大帮助的。

3。说实话索引就是一个数据库。他可以更新,删除,修改等。
先记录下这么多,以后在项目中实践的时候,继续说说我的理解
理解可能偏差比较大。大家不要被我误导啊。
不错的关于lucene英文书 点此下载。


爬虫工作室 -- 专业的手机软件开发工作室
3G视线 -- 专注手机软件开发

你可能感兴趣的:(Lucene学习一)