Heritrix在Eclipse中的配置

下载Heritrix,可以到SourceForge.net上去下载,需要下载的压缩文件包有两个,如下:

heritrix-1.14.2.zip 和 heritrix-1.14.2-src.zip。

1、在eclipse中建立java project,并在project layout选项中选择"use project folder as root for sources and class files"项。

2、将heritrix-1.14.2-src.zip和heritrix-1.14.2.zip分别解压。

3、将heritrix-1.14.2-src.zip解压文件中的的lib目录复制到project中,并将lib下文件设定到eclipse的build path下。

4、将heritrix-1.14.2-src.zip 中src/java目录下的org和st文件夹复制到project中。
5、将heritrix-1.14.2-src.zip 中src/conf目录下的modules、profiles、selftest文件夹和heritrix.properties、jndi.properties文件复制到project中。

6、将heritrix-1.14.2-src.zip 中src/resources目录下的arcMetaheaderBody.xsl文件复制到project中。

7、将heritrix-1.14.2.zip中的webapps目录下admin.war和selftest.war文件复制到project中。

 

8、在project中打开heritrix.properties文件设置用户名密码,heritrix.cmdline.admin = 用户名:密码。用户名和密码之间用冒号相隔。

9、在run configurations中选择Arguments选项卡,在VM arguments中设置虚拟内存,我的设置为-Xmx512m

10、在org.archive.crawler包中找到Heritrix.java文件并运行。可以在浏览器中键入http://127.0.0.1:8080察看结果。如图所示:

 Heritrix在Eclipse中的配置_第1张图片

输入用户名、密码后login,结果如图:

Heritrix在Eclipse中的配置_第2张图片

 

你可能感兴趣的:(试验笔记)