Lucene 索引滚动流程设计

Lucene 索引滚动流程设计
TangFulin <[email protected]>
一. Index Writer:
1. 这里的 Writer 包括 Index Updater 和 Index Rebuilder ,但 Rebuilder 产生的索引文件不直接传送给 Searcher 使用,
而是覆盖 Updater 的索引,由 Updater 统一处理后续的流程
2. IndexUpdaterScheduler 每隔一段时间会设置 copy out timer 标识。
3. Updater 每次处理完一批 xml 文件后会查看 copy out timer 标识是否已经被设置,
如果是,则将当前的索引拷贝一份到 src-snap 目录下 yyyyMMddHHmm 格式的子目录中
4. Updater 为单线程,每次处理完一批 xml 后都会调用 optimizeAndCloseIdx ,所以可以保证 idx 数据是完整的
5. 拷贝数据完成后,在该子目录下 touch 一个 copy.d [...]

你可能感兴趣的:(xml,Lucene,Gmail)