【HDFS篇03】HDFS客户端操作 --- 开发环境准备

存储越困难,提取越容易

HDFS客户端操作---开发环境准备

步骤一:编译对应HadoopJar包,配置Hadoop变量

【HDFS篇03】HDFS客户端操作 --- 开发环境准备_第1张图片

步骤二:创建Maven工程,导入pom依赖


		
			junit
			junit
			RELEASE
		
		
			org.apache.logging.log4j
			log4j-core
			2.8.2
		
		
			org.apache.hadoop
			hadoop-common
			2.7.2
		
		
			org.apache.hadoop
			hadoop-client
			2.7.2
		
		
			org.apache.hadoop
			hadoop-hdfs
			2.7.2
		

步骤三:创建日志文件

在resources目录下创建log4j.properties,输入如下信息

log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

步骤四:创建HDFSClient类

public class HDFSClient{	

@Test
public void testMkdirs() throws IOException, InterruptedException, URISyntaxException{
		
		// 1 获取文件系统
		Configuration configuration = new Configuration();

		// 2 连接集群
		FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "zhutiansama");
		
		// 3 创建目录
		fs.mkdirs(new Path("/1108/daxian/banzhang"));
		
		// 4 关闭资源
		fs.close();
	}
}

​ 客户端去操作HDFS时,是有一个用户身份的。默认情况下,HDFS客户端API会从JVM中获取一个参数来作为自己的用户身份:-DHADOOP_USER_NAME=zhutiansama,zhutiansama为用户名称。至此Hadoop的Win开发环境搭建完成,大家可以通过API去操作Hadoop啦

相关资料

【HDFS篇03】HDFS客户端操作 --- 开发环境准备_第2张图片

本文配套GitHub:https://github.com/zhutiansama/FocusBigData

你可能感兴趣的:(【HDFS篇03】HDFS客户端操作 --- 开发环境准备)