Apache Lucene 4.2 来了!!! 值得关注的改进内容:
- Lucene 4.2 使用新的默认编码器 (Lucene42Codec) ,使用更高效的 docvalues 格式,FST 排序,更少的定位开销,改进数值压缩;更小的术语向量
- 简化 Doc values external 和编码器 API 以及实现,数值类型合并后只包含三种类型 (NUMERIC, BINARY, SORTED); PerFieldDocValuesFormat 可让你为每个字段设置不同格式
- facet 模块的重构和性能提升,大约 3.8 倍的提升
- facet 模块的 DrillDownQuery 支持 multi-select
- 新的 DrillSideways 类用于对 facet 标签的计数,详情请看 这里
- 添加额外的 docvalues 类型 (SORTED_SET) 用于支持多值
- FSTs 更小,FST包支持超过 2GB 大小
- 新的 LiveFieldValues 类可以实时获取值, 详情
- 增加新的 classification 模块
- 对 4.1 版本的优化和 bug 修复
从这些改变上可看出 4.2 版本是不兼容 4.1 的索引。