Lucene对老系统增加全文检索的看法

网友的一个提问: http://topic.csdn.net/u/20081228/20/c5c3e063-74d7-475f-a0d1-bec5ed163b8b.html

最近老板让做一个项目,给一个已经开发好的PDM(产品数据管理)系统做全文搜索引擎。这个系统是UGS公司给做的,系统的功能相当的强大,但是它的查询系统不是很好。我决定用Lucene这个全文检索引擎对它进行改进。

        现在我对Lucene这个全文搜索引擎基本熟悉了,并做了一个桌面的搜索引擎,类似于windows的狗狗搜索,但是这两个搜索引擎不是一个概念,就是搜 索机制是不一样的。但是我不知怎样在PDM系统里实现,也就是不知在数据库里怎样实现。我觉得主要就是怎样对PDM系统的文档做全文索引并建立一索引库。

    我不知是应该给每个文档做索引,还是统一做索引,如果是遍历所有的文档然后做索引,那么这个索引库应该怎样建立呢?我查了好多文献,大家好像都没有提到具 体的实现。可能是我对数据库知识知道的太少了,把别人认为简单的问题想复杂了,还是怎样呢?请大家给指点啊。


我的回复如下:

 是这样,把你要搜索的数据,都要做索引,但常见的是标题,关键字和正文三部分。

然后把数据库里这几个字段的数据和主键一块保存到索引里面就行了。

全文搜索时,你能难道满足条件的主键,剩下的都好做了。

至于索引更新,应该在原有系统里做插件或者二次开发,在原系统发生要全文检索的数据变更时,比如增加,编辑等,要立即更新索引。

lucene支持增量索引,速度不错。

过一段时间,记得做一次重建全部索引,提升速度。

你可能感兴趣的:(Lucene对老系统增加全文检索的看法)