在安装nutch之前,所需要的工作是安装jdk,以及tomcat
链接:
http://blog.csdn.net/u012965373/article/details/42681737
接下来在官网下载好nutch1.4.我这里用winSCP上传到/usr/software目录下。
开始安装,先把文件复制到hadoop目录下。
cp /usr/software/apache-nutch-1.4-bin.tar.gz /usr/hadoop
解压:
tar -zxvf /usr/hadoop/apache-nutch-1.4-bin.tar.gz
然后改名字
mv /usr/hadoop/apache-nutch-1.4-bin /usr/hadoop/nutch
然后切换到/hadoop/目录内
cd /usr/hadoop/
ll
查看一下。
接着把文件夹nutch权限交给hadoop用户组下的hadoop用户、
chown -R hadoop:hadoop ./nutch
接下来去/etc/profile配置nutch环境。
vim /etc/profile
输入如下:
# set nutch environment
export NUTCH_HOME=/usr/hadoop/nutch
export PATH=$PATH:$ NUTCH _HOME /runtime/local/bin
cd /usr/hadoop/nutch/runtime/local/bin
接着测试nutch。
./nutch
发现报错,用不了。
是因为没有执行的权限,所以输入如下命令,赋予权限、
chmod 755 ./nutch
再执行,就可以看到如下所示了:
OK,看到这里就是安装成功了。