Apache lucene 介绍

Apache lucene 介绍

apacche lucene 是开源、高性能、支持全文搜索、跨平台的java API库;理论上它可以用于任何需要实现全文搜索功能的应用。

Apache lucene 特性

可扩展、高性能索引

  • 在现代硬件,索引效率可达150GB/h
  • 内存占用低,只需要使用1MB的堆空间
  • 增量索引速度接近批量索引
  • 索引大小大约是索引文本大小的20~30%

强大、精确、高效的搜索算法

  • 支持权重查询,首先将最优结果返回
  • 支持多种查询类型,句子查询、通配符查询、临近查询、范围查询等等
  • 支持字段搜索,例如文章的标题、作者、内容等等
  • 支持任一字段排序
  • 对合并结果支持多索引查询
  • 可同时进行更新和查询
  • 支持分面搜索,可对结果进行分组,连接
  • 快速,高效内存调用,容错支持
  • 插件化权重模块,包括Vector SpaceModel和Okapi BM25
  • 可配置的存储引擎

跨平台解决方案

  • 基于Apache Licene的开源框架
  • 百分百纯java编写

你可能感兴趣的:(Apache lucene 介绍)