java实现搜索引擎,全文检索,超大数据量查询,lucene

      java开发过程中有时候会遇到在几百万甚至上千万条数据记录中检索,或者是对服务器硬盘上某个文件夹进行检索。这个时候需要用到lucene了。

     lucene的开发需要用到以下几个包

     lucene-core-2.0.0.jar   核心包

     lucene-analyzers-2.2.0.jar 分析包

     lucene-highlighter-2.3.1.jar

     paoding-analysis.jar  这个包是中科院提供的汉语分词包,关于搜索引擎的分词这里不再赘述。

     此外如果用到第三方的,比如lucene-regex-3.0.0.jar(正则表达式包)等等

    

     硬盘搜索比较简单,这里不再赘述,这里只说一下数据库搜索引擎处理:

    

    

你可能感兴趣的:(Java技术)