SpringBoot项目集成HDFS API

  1. Java操作HDFS主要涉及以下几个主要的类
  • Configuration:封装了客户端或者服务器的配置信息;
  • FileSystem:此类的对象是一个文件系统对象,可以用该对象的一些方法来对文件进行操作通过FileSystem的静态方法get获得该对象,例:FileSystem hdfs = FileSystem.get(conf);
  • FSDataInputStream:这是HDFS中的输入流,通过由FileSystem的open方法获取;
  • FSDataOutputStream:这是HDFS中的输出流,通过由FileSystem的create方法获取。
  1. 引入pom依赖
		
			org.apache.hadoop
			hadoop-common
			3.1.1
		
		
			org.apache.hadoop
			hadoop-hdfs
			3.1.1
		
		
			org.apache.hadoop
			hadoop-client
			3.1.1
		
  1. 使用FileSystem API操作HDFS
    Java代码中操作HDFS请参照文章对应的hdfs-demo和https://blog.csdn.net/linhaiyun_ytdx/article/details/90486277。

你可能感兴趣的:(大数据技术)