增量索引的解决方案

1.索引主要面对的对象是我们的文件系统和数据库系统,文件系统包含html doc txt pdf xml rtf ppt等等,数据库系统就不用多说了,就是数据库表中的数据。

     2.如何对他们做增量索引呢?

      1) 如果是文件系统的话,需要判断文件最后的修改时间,我们以上一次做索引的起始时间为开始,本次做索引的时间为结束,文件修改时间位于这一个时间段内的文档可以做索引,形成增量索引文件,然后将增量索引文件合并到原来的索引文件中,不过要注意处理那些更新的文件哦,否则会有重复记录的,实在不行每隔一个月做一次全量索引。

       2)如果是对数据库系统做增量索引的话,可以有很多种解决方案,第一,可以采用compass机制实现实时索引,这个有一定的局限性,假如系统已成成型不能改动的话就无法实现了;第二,可以采用在数据库表处加入触发器,将变更的记录的ID记录到一个自己设计的数据库表中,定时检查这个表中的新记录ID,再根据这个ID找到相应的表记录进行索引; 第三,在数据库表中做一个时间戳,根据时间取增量,其中各个方法的优劣就不用说了吧.

你可能感兴趣的:(html,xml)