索引算法的思考

  lucene的索引算法?数据库的索引跟它有什么不同?为什么

lucene用倒排索引,索引文件保存关联文件的引用。(类似于哈希散列)

而数据库的索引用R-tree算法

 

1.

数据库有时候需要排序,而lucene不需要

 

数据库查询的时候存在在对记录的某一部分进行查询

 

而lucene不会对url的一部分进行查询

 

百度不支持搜索时加上某个网站的条件

 

2.

数据库有较多的插入修改和删除,而lucene主要是查询.

 

 

 

lucene索引的增量更新比较麻烦。

你可能感兴趣的:(算法,百度,Lucene)