使用java访问HDFS

文章目录

  • 利用Java编写程序访问HDFS
    • 1、创建Maven项目
    • 2、添加相关依赖
    • 3、创建日志属性文件
    • 4、启动集群HDFS服务
    • 5、在HDFS上创建文件

利用Java编写程序访问HDFS

1、创建Maven项目

  • 创建Maven项目 - HDFSDemo
    使用java访问HDFS_第1张图片

  • 单击【Create】按钮
    使用java访问HDFS_第2张图片

2、添加相关依赖

  • pom.xml文件里添加hadoopjunit依赖
<dependencies>             
                           
    <dependency>                                  
        <groupId>org.apache.hadoopgroupId>      
        <artifactId>hadoop-clientartifactId>    
        <version>3.3.4version>                  
    dependency>     
                                
    <dependency>                                  
        <groupId>junitgroupId>                  
        <artifactId>junitartifactId>            
        <version>4.13.2version>                 
    dependency>                                 
dependencies>                                                      
  • Maven Repository(Maven仓库)- https://mvnrepository.com/
    使用java访问HDFS_第3张图片

  • 搜索hadoop
    使用java访问HDFS_第4张图片

  • 单击hadoop-client超链接
    使用java访问HDFS_第5张图片

  • 单击3.3.4超链接
    使用java访问HDFS_第6张图片

3、创建日志属性文件

在resources目录里创建log4j.properties文件

log4j.rootLogger=stdout, logfile
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/hdfs.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

4、启动集群HDFS服务

  • 在主节点上执行命令:start-dfs.sh
    使用java访问HDFS_第7张图片

  • 在Hadoop WebUI界面查看
    使用java访问HDFS_第8张图片

5、在HDFS上创建文件

  • 在HDFS Shell里利用hdfs dfs -touchz命令可以创建时间戳文件

  • /ied01目录创建hadoop.txt文件

  • 创建net.zwh.hdfs包,在包里创建CreateFileOnHDFS

  • 编写create1()方法

package net.zwh.hdfs;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.junit.Test;

import java.net.URI;

/**
 * 功能:在HDFS上创建文件
 */
public class CreateFileOnHDFS {
    @Test
    public void create1() throws Exception {
        // 创建配置对象
        Configuration conf = new Configuration();
        // 定义统一资源标识符(uri: uniform resource identifier)
        String uri = "hdfs://master:9000";
        // 创建文件系统对象(基于HDFS的文件系统)
        FileSystem fs = FileSystem.get(new URI(uri), conf);
        // 创建路径对象(指向文件)
        Path path = new Path(uri + "/ied01/hadoop.txt");
        // 基于路径对象创建文件
        boolean result = fs.createNewFile(path);
        // 根据返回值判断文件是否创建成功
        if (result) {
            System.out.println("文件[" + path + "]创建成功!");
        } else {
            System.out.println("文件[" + path + "]创建失败!");
        }
    }
}

这里导包很容易出错
使用java访问HDFS_第9张图片

  • 运行程序,查看结果
    使用java访问HDFS_第10张图片

  • 利用Hadoop WebUI查看
    使用java访问HDFS_第11张图片

  • /ied01目录里确实创建了一个0字节的hadoop.txt文件,有点类似于Hadoop Shell里执行hdfs dfs -touchz /ied01/hadoop.txt命令的效果,但是有一点不同,hdfs dfs -touchz命令重复执行,不会失败,只是不断改变该文件的时间戳。

再次运行程序,由于hadoop.txt已经存在,此时会提示用户创建失败
使用java访问HDFS_第12张图片

你可能感兴趣的:(探索大数据,java,hdfs,hadoop)