ubuntu15.10下nutch2.2.1+hbase1.1.1搭建爬虫平台(失败的尝试)

前言

这篇博客是建立在上一篇ubuntu15.10下nutch2.2.1+mysql搭建爬虫平台基础上的。劝懵逼的小伙伴看一下。

nutch配置的区别

  • 修改conf/nutch-site.xml

  storage.data.store.class
  org.apache.gora.hbase.store.HBaseStore
  Default class for storing data

  • 修改 conf/gora.properties
gora.datastore.default=org.apache.gora.hbase.store.HBaseStore
gora.sqlstore.jdbc.driver=org.hsqldb.jdbc.JDBCDriver
gora.sqlstore.jdbc.url=jdbc:hsqldb:hsql://localhost/nutchtest
gora.sqlstore.jdbc.user=youth
gora.sqlstore.jdbc.password=
  • 修改ivy/ivy.xml


####结语
剩下的又是漫长的等待,这个月想自己建一个maven,把常用的jar都放进去
####预告
下一篇nutch2.2.1与solr4.5.1的整合

你可能感兴趣的:(ubuntu15.10下nutch2.2.1+hbase1.1.1搭建爬虫平台(失败的尝试))