hadoop笔记(四)HDFS的shell和api

前面进行了hdfs原理的学习,下面进行hdfs的shell操作和api操作。
1、hdfs命令
hadoop的shell分两种,一种是集群的启动命令在sbin下。一种是操作命令是在bin之下。常用的有启动hadoop服务,start-dfs.sh start/stop ;start-yarn start/stop;mr-jobhistory-daemon.sh start/stop ;


hadoop笔记(四)HDFS的shell和api_第1张图片
image.png

hdfs的命令如下:
(1)hdfs dfs -ls/ 查看目录,如果是-lsr,则为递归展示


hadoop笔记(四)HDFS的shell和api_第2张图片
image.png

(2)hdfs dfs -mkdir -p /potti/test 创建文件夹
(3)-put -copyFromLocal -moveFromLocal 文件上传,move移动。
(4)-get -copyToLocal -moveToLocal 文件下载,跟put相反 。
(5)-cat -text 都是查看文件,不同的是cat是copy文件内容显示。text是通过hadoop解析实现文件查看,cat适合一半文件,text是适合全部文件查看。

(6)-rm -rmdir rm是可以删除任何文件,但是rmdir只是删除空文件。
(7)-fsck 查看文件是否有丢失备份异常情况。hdfs fsck /xxx
(8) -report 报告集群情况,hdfs dfsadmin -report 查看磁盘大小,丢失情况等。
(9)-namenode 节点格式化,回滚,升级等操作,查看hdfs namenode -h


hadoop笔记(四)HDFS的shell和api_第3张图片
image.png

(10)-datanode 节点的启动、升级、节点回滚操作等。hdsf -datanode -h
hadoop笔记(四)HDFS的shell和api_第4张图片
image.png

(11)hadoop 命令,有hadoop job 、version、distcp
2、eclipse的环境搭建。
将插件移动到eclipse的plugins下,重启eclipse,切换到mapreduce试图下,配置相关信息,进行api的开发测试。
hadoop笔记(四)HDFS的shell和api_第5张图片
image.png

hadoop笔记(四)HDFS的shell和api_第6张图片
image.png

hadoop笔记(四)HDFS的shell和api_第7张图片
image.png

hadoop笔记(四)HDFS的shell和api_第8张图片
image.png

--测试api代码。
'''
package com.potti.hdfs.hadoop;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import java.net.URI;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.BlockLocation;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.LocatedFileStatus;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.RemoteIterator;
import org.apache.hadoop.io.IOUtils;

import com.potti.ftp2hdfs.util.HdfsUtil;

/**

  • hdfs的API测试
    */
    public class HdfsTest {

    public static void main(String[] args) {

     // test();
     // createNewFile();
     // appTest();
     // openTest();
     // mkdirTest();
     copyFromLocalTest();
     // deleteTest();
      //getFileStatusTest();  //这个方法得到的既有文件也有文件夹。
     //lisTest();  //文件
    

    }

    /**

    • 递归展示文件夹下的文件,迭代只是取数据的展示方式。

    • @throws Exception

    • */
      private static void lisTest() {
      try {
      FileSystem fs = HdfsUtil.getFileSystem();
      RemoteIterator listfile= fs.listFiles(new Path("/"), true);
      while(listfile.hasNext()){
      LocatedFileStatus filestatus=listfile.next();
      System.out.println(filestatus.getAccessTime());
      System.out.println(filestatus.getBlockSize());
      System.out.println(filestatus.getGroup());
      System.out.println(filestatus.getLen());
      System.out.println(filestatus.getModificationTime());
      System.out.println(filestatus.getPermission());
      System.out.println(filestatus.getReplication());
      System.out.println(filestatus.getOwner());

           //可以查阅文件在块在datanode的信息
           BlockLocation[]  blocklocation= filestatus.getBlockLocations();
           for (BlockLocation blockLocation2 : blocklocation) {
               //块的信息
               System.out.println("总长:"+blockLocation2.getLength()+" 结束位置:"+blockLocation2.getOffset());
               String[]  strname=blockLocation2.getNames(); //ip地址
               for (String string1 : strname) {
                   System.out.println("名称--》"+string1);
               }
               String[]  strhost=blockLocation2.getHosts();
               for (String string2 : strhost) {
                   System.out.println("datanode-->"+string2);
               }
               System.out.println("-----------华丽丽的分割线----------");
           }
       }
      

      } catch (Exception e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
      }

}

/***
 * 1.创建文件测试 create()参数比较多
 ***/
public static void test() {
    try {
        Configuration conf = new Configuration(); // 配置文件读取
        conf.set("fs.defaultFS", "hdfs://192.168.0.127:9000"); // 读取hdfs的文件地址
        FileSystem fs = FileSystem.get(conf);
        FSDataOutputStream fsout = fs.create(new Path("/test/test1.txt"), (short) 2);
        BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(fsout));
        bw.write("we are word");
        bw.newLine();
        bw.write("测试完毕!!!");
        bw.close();
        fsout.close();
        fs.close();
        System.out.println("文件写入成功!!");
    } catch (Exception e) {
        e.printStackTrace();
        System.out.println("文件写入失败!!");
    }
}

/**
 * 创建一个新得空文件 createNewFile()
 **/
public static void createNewFile() {

    try {
        Configuration conf = new Configuration(); // 配置文件读取
        conf.set("fs.defaultFS", "hdfs://192.168.20.102:8020"); // 读取hdfs的文件地址
        FileSystem fs = FileSystem.get(conf);
        // 这是绝对路径创建方法
        // boolean isCreate =fs.createNewFile(new
        // Path("/create/newfile.txt"));
        // 相对路径,程序会自动创建用户文件夹,进行创建文件。
        boolean isCreate = fs.createNewFile(new Path("newfile.txt"));
        if (isCreate) {
            System.out.println("创建成功!!");
        } else {
            System.out.println("创建失败!!");
        }
        fs.close();
    } catch (Exception e) {
        e.printStackTrace();
        System.out.println("文件创建失败!!");
    }
}

/**
 * append往文件中写数据
 */

public static void appTest() {

    try {
        Configuration cf = new Configuration();
        cf.set("fs.defaultFS", "hdfs://192.168.20.102:8020");
        FileSystem fs = FileSystem.get(cf);
        // 创建 文件地址
        Path pa = new Path("/create/newfile.txt"); // 绝对地址
        Path pat = new Path("newfile.txt"); // 相对路径
        FSDataOutputStream fsd = fs.append(pat);// 数据添加
        fsd.write("这是添加内容的精神科的急死啦打死了大山里的解散了".getBytes());
        fsd.close();
        fs.close();
        System.out.println("数据追加成功!!");
    } catch (Exception e) {
        e.printStackTrace();
        System.out.println("数据追加失败!!");
    }
}

/**
 * open方法测试 (读取是文本模式)
 **/
/**
 * 
 */
public static void openTest() {
    try {
        FileSystem fs = HdfsUtil.getFileSystem(); // 得到默认配置
        InputStream in = fs.open(new Path("/create/newfile.txt"));
        BufferedReader red = new BufferedReader(new InputStreamReader(in));
        String line = null;
        while ((line = red.readLine()) != null) {
            System.out.println(line);
        }
        red.close();
        in.close();
        fs.close();
    } catch (Exception e) {
        e.printStackTrace();
    }
}

/**
 * mkdirs 创建文件夹的方法
 ***/

public static void mkdirTest() {
    try {
        FileSystem fs = HdfsUtil.getFileSystem();
        boolean bl = fs.mkdirs(new Path("/web/click/weblog"));
        fs.close();
        if (bl) {
            System.out.println("创建文件夹成功!");
        } else {
            System.out.println("创建文件夹失败!!!!");
        }
    } catch (Exception e) {
        e.printStackTrace();
        System.out.println("创建文件夹失败!!");
    }

}

/***
 * 上传和下载 copyfromlocal 本地上传到目标 ,copytolocal 目标下载到本地
 * 
 **/
public static void copyFromLocalTest() {
    try {
         FileSystem fs =HdfsUtil.getFileSystem();
        // 文件上传
         fs.copyFromLocalFile(new Path("E:\\temp\\access.log.fensi"), new
         Path("/web/click/weblog/access.log")); //从一个地址上传到另一个地址
         System.out.println("文件上传完成!!");
        // 文件下载
        // fs.moveFromLocalFile(new
        // Path("/log/output/20170228/access/access.txt-r-00000"), new
        // Path("d:\\copytoTest.txt"));

// String dest = "hdfs://192.168.0.10:8020/byq/output/part-r-00000";
// String local = "d:/temp/byqhdfs.txt";
// FileSystem fsm = FileSystem.get(URI.create(dest), HdfsUtil.getConfiguration());
// FSDataInputStream fsdi = fsm.open(new Path(dest));
// OutputStream output = new FileOutputStream(local);
// IOUtils.copyBytes(fsdi, output, 4096, true);
// System.out.println("文件下载完成!!");
//fsm.close();
fs.close();
} catch (Exception e) {
e.printStackTrace();
System.out.println("文件操作失败!!");
}
}

/**
 * 文件删除方法 delete
 **/
public static void deleteTest() {

    try {
        FileSystem fs = HdfsUtil.getFileSystem();
        boolean isdelete = fs.delete(new Path("/2.txt"), true); // 此方法类似于立马执行
        // boolean isdelete=fs.deleteOnExit(new Path("/create/test"));
        // //此方法类似于程序执行完毕之后,开始执行
        if (isdelete) {
            System.out.println("文件删除成功!!");
        } else {

            System.out.println("文件删除失败!!");
        }
        fs.close();
    } catch (Exception e) {
        e.printStackTrace();
    }
}

/***
 * getFileStatus 查看文件属性
 */
public static void getFileStatusTest() {
    try {
        FileSystem fs = HdfsUtil.getFileSystem();
        FileStatus[] status = fs.listStatus(new Path("/"));

        for (int i = 0; i < status.length; i++) {
            
            status[i].isFile();  //如果是文件夹,其中文件需要自己进行递归。
            System.out.println("文件大小:" + status[i].getLen());
            System.out.println("文件块大小:" + status[i].getBlockSize());
            System.out.println("文件所有者:" + status[i].getOwner());
            System.out.println("文件备份数:" + status[i].getReplication());
            System.out.println("文件路径:" + status[i].getPath());
            System.out.println("文件权限:" + status[i].getPermission());
        }
        fs.close();
    } catch (Exception e) {
        e.printStackTrace();
    }
}

}
'''
完毕。

你可能感兴趣的:(hadoop笔记(四)HDFS的shell和api)