全文检索应用插件

阅读更多
       用了一周多的时间学习全文检索引擎Lucene,同时利用RCP框架构建了一个基于Lucene的桌面检索引擎,因为只是处于学习目的,对实际的功能考虑的不多,目前可以搜索word、pdf、html和普通的文本文件,实际使用的技术除RCP外还有用于读取word文件的POI和读取pdf的PDFBOX,做到后来发现最难处理的是网页文件和mht文件,这里只是当成普通文本来处理了,而在实际的处理过程中,会涉及到JACC或者Antlr方面的应用,放到以后学习中再补上这部分的解析功能。下面是程序中的运行截图。
 
程序的运行菜单
全文检索应用插件_第1张图片
 
程序的配置选项
全文检索应用插件_第2张图片
 
索引维护功能-创建索引
全文检索应用插件_第3张图片
 
 
 
全文检索应用插件_第4张图片
 
索引的删除
全文检索应用插件_第5张图片
 
索引基本信息查看
全文检索应用插件_第6张图片
 
索引的Field中Term 信息显示
全文检索应用插件_第7张图片
 
全文检索,支持使用Not、AND、+、-等关键字组合查询条件
 
对输入条件进行必要的检查
 
对查询的结果,以图形方式显示Score分值大小
全文检索应用插件_第8张图片
 
通过不同关键字组合,缩小搜索范围,下面的例子表示搜索所有包含“lucene”但却不包括“demo”的文件
全文检索应用插件_第9张图片
 
支持不同类型文件的检索
全文检索应用插件_第10张图片
 
检索出的结果可以在预览窗口直接查看文章的内容,同时高亮关键字
全文检索应用插件_第11张图片
 
 
 
 

你可能感兴趣的:(全文检索,lucene,搜索引擎,框架,HTML)