heritrix启动后报空指针异常

在配置好Heritrix的job,Start开始后, 
出现错误:“null”
致命错误:“无法编译样式表”
+0000 严重 org.archive.crawler.framework.WriterPoolProcessor getFirstrecordBody Failed transform javax.xml.transform.TransformerConfigurationException: 无法编译样式表

+0000 严重 org.archive.io.arc.ARCWriter getMetadataLength Unsupported metadata type: null

解决方案:

heritrix-1.14.4-src\src\resources在源码包中或解压jar包,heritrix-1.14.4-src\src\resources  下找到arcMetaheaderBody.xsl文件,复制到你工程的资源包中,再运行即可。

你可能感兴趣的:(Heritrix,爬虫技术)