nutch 插件

现在我涉及到3个插件

1  在建索引的时候添加自定义字段。。实现IndexingFilter接口

2  用户搜索的时候多字段条件搜索。。实现queryFilter接口

3  搜索结果聚合分类,用的是carrot2插件。。实现OnlineClusterer接口

 

 

配置文件。。把插件配置进去

nutch配置文件中的

nutch-site.xml

 

tomcat/页面所在位置下的配置文件

nutch-site.xml

 

不过基本我都是把2个地方的配置文件复制一样的

 

 

现在有个很蛋疼的问题。添加自定义字段的插件 按以往步骤 1 编译插件源码,生成jar包,2复制到nutch/plugin/下(tomcat网站路径那也有个插件位置,但是个人想法   那里放的插件是在用户通过网站调用的 ,但是现在我是通过mian方法调用nutch生成索引,所以应该不需要在tomcat路径下放置插件)。按此步骤生成索引居然不见自定义字段,太奇怪了。

 

jar包在项目源码中只有nutch1.2 .jar 包 ,存放的是nutch源码,

tomcat/网站路径/web-info/classes   放的是nutch配置文件,于nutch源码工程中的一致

tomcat/网站路径/web-info/classes/plugins  放的是nutch插件的jar包,个人人为应该是页面请求调用的

nutch/conf   配置文件

nutch/src/plugin  插件源码

nutch/plugin    插件jar包

 

基本放插件jar包的位置就这几个。

 

工程文件的nutch.jar包-----调用-----nutch/plugins的插件

tomcat ------调用-----/tomcat路径下的plugins

                    不知道是不是正确的。

 

 

 

 

 

XX。。。。。   把nutch源码编译后在build文件下产生的nutch.1.2.jar包复制到工程源码中的lib中覆盖

再用工程建索引就有自定义字段了,为嘛会这样呢?

 

之前编写queryFeilter插件的时候 也只是将自己写的queryFielter插件源码编译后产生的jar复制到nutch/plugins路径下就能调用了阿

 

 

 

 

 

你可能感兴趣的:(nutch 插件)