我的Heritrix学习之路(一)

在Windows平台下,先把Heritrix启动起来

详细步骤如下:

1、老规矩,开源的东西,先下载,亲测地址:http://nchc.dl.sourceforge.net/project/archive-crawler/archive-crawler%20%28heritrix%201.x%29/1.14.4/heritrix-1.14.4.zip

2、将下载的heritrix-1.14.4.zip解压到本地,如D:/ 目录下;

3、进入D:/heritrix-1.14.4/conf目录中,将jmxremote.password.template文件拷贝到 D:/heritrix-1.14.4目录下,并且修改

该文件名称为jmxremote.password

4、打开jmxremote.password文件,翻到最后两行,将最后两行中的@PASSWORD@修改为自己想设置的密码,如全部修改为如下格式:

monitorRole admin

controlRole  admin

保存该文件;

5、设置jmxremote.password文件的访问属性,右击-属性(这里勾上“只读”)-安全标签-权限-更改权限-去掉“包括从该对象的父项继承的权限”,删除除了当前用户外的其他用户;

6、配置heritrix-1.14.4/conf目录下的heritrix.properties文件中的如下信息:

heritrix.cmdline.admin = admin (等号后面的admin是admin用户的登录密码,与jmxremote.password文件中设置的一致)
heritrix.cmdline.port = 8888 (此处,端口号设置为不冲突的即可)
heritrix.cmdline.run = false
heritrix.cmdline.nowui = false
heritrix.cmdline.order =

7、重启电脑(做了上述的配置,总是启动不起来,后来发现重启之后就ok了,原因无法解释)

8、cmd,切换到heritrix的bin目录下,输入命令:

heritrix --admin=admin:admin

出现:Heritrix 1.14.4 is running.

           Web console is at :http://127.0.0.1:8888

           Web console login and password :admin/admin

这样的字样的话,说明heritrix启动成功;

同时,会打开一个管理员:Heritrix的终端窗口,显示一些版本信息等;

9、在浏览器中打开:http://127.0.0.1:8888,输入登录名和密码,登录成功!

至此,Heritrix就真正地启动起来了!

                                     


你可能感兴趣的:(Heritrix)