2.2 分布式文件系统HDFS

  • 编程要求

        1.在HDFS中创建/usr/output/文件夹;

        2.在本地创建hello.txt文件并添加内容:“HDFS的块比磁盘的块大,其目的是为了最小化寻址开销。”;

        3.将hello.txt上传至HDFS/usr/output/目录下;

        4.删除HDFS/user/hadoop目录;

        5.将Hadoop上的文件hello.txtHDFS复制到本地/usr/local目录。

  • 开始编程

        1.启动Hadoop

start-dfs.sh

          启动成功结果如下图:2.2 分布式文件系统HDFS_第1张图片

        2.HDFS中创建/usr/output/文件夹:

hadoop fs -mkdir /usr
hadoop fs -mkdir /usr/output/

        3.在本地创建hello.txt文件:

touch hello.txt

        进入hello.txt文件:

vim hello.txt   

        按i,输入“HDFS的块比磁盘的块大,其目的是为了最小化寻址开销。

        按Esc,输入:wq保存并退出hello.txt文件

        4.hello.txt上传至HDFS/usr/output/目录下:

hadoop fs -put hello.txt /usr/output/

        5.删除HDFS/user/hadoop目录:

hadoop fs -rmr /user/hadoop

        出现以下界面表示删除成功:

 

 

        6.Hadoop上的文件hello.txtHDFS复制到本地/usr/local目录:

hadoop fs -copyToLocal /usr/output/hello.txt /usr/local

下图列出了Hadoop常用的shell命令: 

2.2 分布式文件系统HDFS_第2张图片

你可能感兴趣的:(大数据技术与应用,大数据)