使用java API 操作HDFS

由于 Hadoop 是使用Java语言编写的,因此可以使用Java API操作Hadoop文件系统。 HDFS Shell本质上就是对Java API的应用,通过编程的形式操作HDFS,其核心是使用HDFS提供的Java API构造一个访问客户端对象,然后通过客户端对象对HDFS上的文件进行操作(增、删、改、查)

一、首先我们要在电脑上配置hadoop环境

(1)搭建一个项目环境,然后初始化客户端对象

首先在项目src文件夹下创建comnjci.hdfsDemo包,并在该包下创建HDFS_CRUD.java文件,编写Java测试类,构建Configuration和FileSystem对象,初始化一个客户端实例进行相应的操作。

使用java API 操作HDFS_第1张图片

二、上传到HDFS(用Java测试类来实现JavaApi对HDFS的操作) 

使用java API 操作HDFS_第2张图片

三、从hdfs下载文件到本地

在HDFS_CRUD.java文件中添加一个testDownloadFileToLocal()方法,来实现从HDFS中下载文件到本地系统的功能。

 使用java API 操作HDFS_第3张图片

 四、目录操作

在HDFS_CRUD.java文件添加一个testMkdirAndDeleteAndRename()方法,实现目录的创建、删除、重命名的功能。非空时,则参数2必须为true,表示递归删除

使用java API 操作HDFS_第4张图片

 五、查看文件目录

在HDFS_CRUD.java文件中添加一个testListFiles()方法,实现查看目录中所有文件的详细信息的功能。

使用java API 操作HDFS_第5张图片

/  总结/

 
 

你可能感兴趣的:(java,hdfs,hadoop)