[Nutch]hadoop启用回收站

目前hadoop在默认情况下是没有启用回收站的,如果文件被删除是没有办法恢复的,所以我们需求启用回收站,以便于恢复已经删除的文件。

1. 用hadoop创建一个文件夹

使用如下的命令在hadoop的文件系统里面创建一个文件夹urls:

hadoop fs -mkdir urls

用如下命令进行查看:

hadoop fs -ls

如下:
这里写图片描述

在web里面也可以查看到:
[Nutch]hadoop启用回收站_第1张图片

2. 删掉文件

使用如下命令进行删除:

hadoop fs -rmr urls

提示文件已经被删掉,如下:
这里写图片描述

在web里面也找不到这个文件了:
[Nutch]hadoop启用回收站_第2张图片

3. 启用回收站

需要制定文件被删除后保留的时间,超出这个时间会被自动删除。
我们首先在host1上停止dfs:

stop-dfs.sh

如下:

在host3上停止jobtracker:

stop-mapred.sh

如下:
这里写图片描述

在conf/core-site.xml里面添加如下内容:

<property>
  <name>fs.trash.interval</name>
  <value>10080</value>
</property>

如下图:
[Nutch]hadoop启用回收站_第3张图片

复制文件到host2和host3上:

scp conf/core-site.xml host2:/home/hadoop/workspce/hadoop-1.2.1/conf/core-site.xml
scp conf/core-site.xml host3:/home/hadoop/workspce/hadoop-1.2.1/conf/core-site.xml

如下图:

4. 验证

启动dfs:

start-dfs.sh

这里写图片描述

新建文件夹urls:

hadoop fs -mkdir urls

如下:
这里写图片描述

删除文件夹urls:

hadoop fs -rmr urls

文件urls就被移到回收站了,如下图:
这里写图片描述

从web管理页面就可以看到回收站目录:.Trash

你可能感兴趣的:(hadoop,回收站,Nutch,文件系统)