heritrix 下载、安装、配置、以及简单开发 编辑


一、下载:

到www.sourceforge.net网站搜索heritrix,然后分别下载下来hheritrix-1.14.4-src.zip,heritrix-1.14.4.zip

下载地址:http://sourceforge.net/projects/archive-crawler/files/archive-crawler%20%28heritrix%201.x%29/

 

 

     二、配置

 

1.解压heritrix-1.14.4.zip,假设解压到了c盘根目录下并把解压后的文件夹命名为heritrix

 

2.进入c:/heritrix/conf复制文件jmxremote.password.template到c:/heritrix下并把文件重新命名为jmxremote.password,

 

          然后修改其内容为下:

           monitorRole  @123456789@ ->monitorRole admin (@于@之间设置的是密码,后面是->用户角色用户名)

           controlRole  @123456789@ ->controlRole shi 

          并设置文件jmxremote.password的属性为只读

 

3.进入c:/heritrix/conf打开文件heritrix.properties,修改其中的几项key-value值

          heritrix.cmdline.admin = admin:770629 (用户名:密码)

          heritrix.cmdline.port = 8080 (heritrix服务器默认端口号8080,保证该端口不被占用就不用改了)

 

4.打开cmd,切换目录到c:/heritrix/bin

          然后敲入命令:heritrix.cmd --admin=admin:123456789

会出现如下错误:

  1. WARNING: It's currently not possible to run Heritrix in background  
  2.          on Windows. It was just started minimized in a new Window  
  3.          and will be shut down as soon as you log off.  
  4.   
  5. 2011/02/25 周五 23:49:27.00 Starting heritrix  
  6.   
  7. Heritrix failed to start properly. Possible causes:  
  8.   
  9. - Login and password have not been specified (see --admin switch)  
  10. - another program uses the port for the web UI (8080 by default)  
  11.   (e.g. another Heritrix instance)  
  12. - JMX password file is missing or permissions not set correctly  
  13.   
  14.   
  15. JMX permissions file missing. A template can be found in  
  16.   E:\framework\heritrix-1.14.4\conf\jmxremote.password.template.  
  17. Copy it to  
  18.   E:\framework\heritrix-1.14.4\jmxremote.password  
  19. and edit the passwords at the end of the file. Then, make sure  
  20. the file is read-restricted to only the user that the Heritrix  
  21. Java VM will run as. For example: 

 

5. 再设置文件的为只读,并且要设置文件的拥有者只能为当前登录系统的用户,删除文件的其他用户或角色权限。修改方法:

   文件->属性->"安全"标签页->高级->"权限"标签页->更改权限按钮

    ->取消"包括从该对象的父项继承的权限"的勾选-,同时再删除其他多余的用户或角色权限(只留下当前登录系统的用户)

如果删除不了要全部设定他们的权限限定

 



heritrix 下载、安装、配置、以及简单开发 编辑_第1张图片
 里面的用户要全部设定权限,不然会报错的要


heritrix 下载、安装、配置、以及简单开发 编辑_第2张图片


你可能感兴趣的:(c,服务器,cmd)