heritrix 下载、安装、配置、以及简单开发

 

 

一、下载:

www.sourceforge.net 网站搜索heritrix, 然后分别下载下来hheritrix-1.14.4-src.zip,heritrix-1.14.4.zip

下载地址:http://sourceforge.net/projects/archive-crawler/files/archive-crawler%20%28heritrix%201.x%29/

 

 

      二、配置

 

1. 解压 heritrix-1.14.4.zip ,假设解压到了c 盘根目录下并把解压后的文件夹命名为heritrix(http://www.my400800.cn

 

2. 进入c:/heritrix/conf 复制文件jmxremote.password.templatec:/heritrix 下并把文件重新命名为jmxremote.password

 

          然后修改其内容为下:

           monitorRole  @123456789@ ->monitorRole admin (@ @ 之间设置的是密码, 后面是-> 用户角色用户名)

           controlRole  @123456789@ ->controlRole shi 

           并设置文件jmxremote.password 的属性为只读

 

3. 进入c:/heritrix/conf 打开文件heritrix.properties ,修改其中的几项key-value

          heritrix.cmdline.admin = admin:770629 ( 用户名:密码)

          heritrix.cmdline.port = 8080 (heritrix 服务器默认端口号8080, 保证该端口不被占用就不用改了)

 

4. 打开cmd ,切换目录到c:/heritrix/bin

          然后敲入命令:heritrix.cmd --admin=admin:123456789

会出现如下错误:

  1. WARNING: It's currently not possible to run Heritrix in background  
  2.          on Windows. It was just started minimized in a new  Window  
  3.          and will be shut down as soon as you log off.  
  4.   
  5. 2011 / 02 / 25  周五  23 : 49 : 27.00  Starting heritrix  
  6.   
  7. Heritrix failed to start properly. Possible causes:  
  8.   
  9. - Login and password have not been specified (see --admin switch )  
  10. - another program uses the port for  the web UI ( 8080  by  default )  
  11.   (e.g. another Heritrix instance)  
  12. - JMX password file is missing or permissions not set correctly  
  13.   
  14.   
  15. JMX permissions file missing. A template can be found in  
  16.   E:\framework\heritrix-1.14 . 4 \conf\jmxremote.password.template.  
  17. Copy it to  
  18.   E:\framework\heritrix-1.14 . 4 \jmxremote.password  
  19. and edit the passwords at the end of the file. Then, make sure  
  20. the file is read-restricted to only the user that the Heritrix  
  21. Java VM will run as. For example: 

 

5. 再设置文件的为只读,并且要设置文件的拥有者只能为当前登录系统的用户,删除文件的其他用户或角色权限。修改方法:

   文件->属性->"安全"标签页->高级->"权限"标签页->更改权限按钮

    ->取消"包括从该对象的父项继承的权限"的勾选-,同时再删除其他多余的用户或角色权限(只留下当前登录系统的用户)

如果删除不了要全部设定他们的权限限定

 



heritrix 下载、安装、配置、以及简单开发
 里面的用户要全部设定权限,不然会报错的要


heritrix 下载、安装、配置、以及简单开发

 

 

你可能感兴趣的:(java,Heritrix)