Apache Lucene 4.2 发布,又是全新版本

Apache Lucene 4.2 来了!!! 值得关注的改进内容:

  • Lucene 4.2 使用新的默认编码器 (Lucene42Codec) ,使用更高效的 docvalues 格式,FST 排序,更少的定位开销,改进数值压缩;更小的术语向量
  • 简化 Doc values external 和编码器 API 以及实现,数值类型合并后只包含三种类型 (NUMERIC, BINARY, SORTED); PerFieldDocValuesFormat 可让你为每个字段设置不同格式
  • facet 模块的重构和性能提升,大约 3.8 倍的提升
  • facet 模块的 DrillDownQuery 支持 multi-select
  • 新的 DrillSideways 类用于对 facet 标签的计数,详情请看 这里
  • 添加额外的 docvalues 类型 (SORTED_SET) 用于支持多值
  • FSTs 更小,FST包支持超过 2GB 大小
  • 新的 LiveFieldValues 类可以实时获取值, 详情
  • 增加新的 classification 模块
  • 对 4.1 版本的优化和 bug 修复

从这些改变上可看出 4.2 版本是不兼容 4.1 的索引。

你可能感兴趣的:(软件更新新闻)