打造自己的搜索引擎

这周项目要做一个搜索引擎系统,于是,我看看了看上下左右,看来只有我来弄了~~ 

代码其中参考了@红薯的Lucene 早年分享的代码,与一些朋友的精华博客。算是入门了,这个入门花了我40篇日志。

 打造自己的搜索引擎_第1张图片

 

需求

项目中会用到搜索,需求不复杂:根据关键字,搜索出文章,公司,产品。

 

技术

Java(Spring)用于查询数据源,用的是,JDK7。

Lucene 做的是搜索,存储功能,用的是,Lucene5。

IKAnalyzer做的是分词功能,用的是,IKAnalyzer5。

 

关键点

1.Lucene的多个索引目录的近实时搜索。

因为涉及到公司,产品,文章,所以建立了多个索引,需要在多个索引之间进行查询,如果索引发生变更,则需要立马查询到最新数据。

2.分页与文章段落标红显示。

Lucene的分页功能,一定要优化~

关键字标红功能,特别是文章某一段匹配了关键字,然后只显示那一段前后的文字,效果图里有效果,详情里前后有"..."的就是,不是整个内容全部显示,而是某一部分前后标红显示。

3.查询公司名称时只输入公司名一个字搜索不到公司。

这时就需要扩展词典,将useSmart关闭。

 

效果图

打造自己的搜索引擎_第2张图片

 

 

 未完待续~~~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(java,Lucene,IKAnalyzer,引擎,搜素)