Nutch自带查询页面测试是否能够配置多个索引路径

1.     背景

  现在有两个含有索引的文件夹,位置分别是:E:\out E:\baidutieba;用luke查看索引,发现在E:\baidutieba的索引中的host域里包括以下内容

在E:\out的host域中,包含内容。

2.     测试步骤

2.1. 修改nutch-site.xml,修改内容如下:

<value>/out</value>

<value>/baidutieba/topic</value>

2.1.1在nutch自带的查询页面查找ifeng没有内容,去掉后一个value后,则有内容。

2.2. <value>/out ; /baidutieba/topic </value>

2.2.1启动tomcat时报错,去掉;以及后面的路径则不报错

2.3. <value>/out, /baidutieba/topic </value>

2.3.1查询时出现空指针异常,去掉,以及后面的路径不报错

3.     初步结论

Nutch不能配置两个索引路径。

4.     后续观察

4.1.了解NutchBean或Configuration是如何加载search.dir这个元素的值的,以此来做更深入的理解。

你可能感兴趣的:(tomcat,测试)