一、下载:
到www.sourceforge.net 网站搜索heritrix, 然后分别下载下来hheritrix-1.14.4-src.zip,heritrix-1.14.4.zip
下载地址:http://sourceforge.net/projects/archive-crawler/files/archive-crawler%20%28heritrix%201.x%29/
二、配置
1. 解压 heritrix-1.14.4.zip ,假设解压到了c 盘根目录下并把解压后的文件夹命名为heritrix(http://www.my400800.cn )
2. 进入c:/heritrix/conf 复制文件jmxremote.password.template 到c:/heritrix 下并把文件重新命名为jmxremote.password ,
然后修改其内容为下:
monitorRole @123456789@ ->monitorRole admin (@ 于@ 之间设置的是密码, 后面是-> 用户角色用户名)
controlRole @123456789@ ->controlRole shi
并设置文件jmxremote.password 的属性为只读
3. 进入c:/heritrix/conf 打开文件heritrix.properties ,修改其中的几项key-value 值
heritrix.cmdline.admin = admin:770629 ( 用户名:密码)
heritrix.cmdline.port = 8080 (heritrix 服务器默认端口号8080, 保证该端口不被占用就不用改了)
4. 打开cmd ,切换目录到c:/heritrix/bin
然后敲入命令:heritrix.cmd --admin=admin:123456789
会出现如下错误:
5. 再设置文件的为只读,并且要设置文件的拥有者只能为当前登录系统的用户,删除文件的其他用户或角色权限。修改方法:
文件->属性->"安全"标签页->高级->"权限"标签页->更改权限按钮
->取消"包括从该对象的父项继承的权限"的勾选-,同时再删除其他多余的用户或角色权限(只留下当前登录系统的用户)
如果删除不了要全部设定他们的权限限定