Hadoop HDFS组件内置了HDFS集群的一键启停脚本。
$HADOOP_HOME/sbin/start-dfs.sh,一键启动HDFS集群
start-dfs.sh
执行原理:
$HADOOP_HOME/sbin/stop-dfs.sh,一键关闭HDFS集群
stop-dfs.sh
执行原理:
除了一键启停外,也可以单独控制进程的启停。
hadoop-daemon.sh start namenode
hdfs --daemon start namenode
HDFS作为分布式存储的文件系统,有其对数据的路径表达方式。
HDFS同Linux系统一样,均是以/作为根目录的组织形式。
协议头file:/// 或 hdfs://node1:8020/可以省略
需要提供Linux路径的参数,会自动识别为file://
需要提供HDFS路径的参数,会自动识别为hdfs://
除非你明确需要写或不写会有BUG,否则一般不用写协议头
.
关于HDFS文件系统的操作命令,Hadoop提供了2套命令体系。
两者在文件系统操作上,用法完全一致,用哪个都可以。
某些特殊操作需要选择hadoop命令或hdfs命令。
hadoop fs -mkdir [-p] < path> …
hadoop fs -mkdir -p /it/bigdata
hdfs dfs -mkdir [-p] < path> …
hdfs dfs -mkdir -p /it/hadoop
hadoop fs -ls [-h] [-R] [< path> …]
查看/目录下的内容
hadoop fs -ls /
hdfs dfs -ls [-h] [-R] [< path> …]
递归查看/下的内容
hdfs dfs -ls -R /
hadoop fs -put [-f] [-p] < localsrc> … < dst>
新建一个文件,复制到/it目录下
hadoop fs -put text.txt /it
hdfs dfs -put [-f] [-p] < localsrc> … < dst>
如果存在,直接覆盖
hdfs dfs -put -f text.txt /it
hadoop fs -cat < src> …
读取指定文件全部内容,显示在标准输出控制台。
hadoop fs -cat /it/text.txt
hdfs dfs -cat < src> …
读取指定文件全部内容,显示在标准输出控制台。
hdfs dfs -cat /it/text.txt
读取大文件可以使用管道符配合more
按空格下一页
hdfs dfs -cat /it/text2.txt | more
hadoop fs -get [-f] [-p] < src> … < localdst>
hdfs dfs -get [-f] [-p] < src> … < localdst>
下载文件到本地文件系统指定目录,localdst必须是目录
下载text.txt文件到当前的本地目录
hdfs dfs -get /it/text.txt ./
hadoop fs -cp [-f] < src> … < dst>
hdfs dfs -cp [-f] < src> … < dst>
-f 覆盖目标文件(已存在下)
拷贝HDFS文件到HDFS目录
hdfs dfs -cp /it/text.txt /it/test
hdfs dfs -cp /it/text.txt /it/test/text11.txt
hadoop fs -appendToFile < localsrc> … < dst>
hdfs dfs -appendToFile < localsrc> … < dst>
将所有给定本地文件的内容追加到给定dst文件。
hdfs dfs -appendToFile 2.txt 3.txt /it/1.txt
hadoop fs -mv < src> … < dst>
hdfs dfs -mv < src> … < dst>
移动文件到指定文件夹下。
可以使用该命令移动数据,重命名文件的名称。
hdfs dfs -mv /it/1.txt /it/test
hadoop fs -rm -r [-skipTrash] URI [URI …]
hdfs dfs -rm -r [-skipTrash] URI [URI …]
删除指定路径的文件或文件夹
hdfs dfs -rm -r /it/text2.txt
回收站功能默认关闭,如果要开启需要在core-site.xml内配置:
<property>
<name>fs.trash.intervalname>
<value>1440value>
property>
<property>
<name>fs.trash.checkpoint.intervalname>
<value>120value>
property>
无需重启集群,在哪个机器配置的,在哪个机器执行命令就生效。
回收站默认位置在:/user/用户名(hadoop)/.Trash
官方指导文档:https://hadoop.apache.org/docs/r3.3.4/hadoop-project-dist/hadoop-common/FileSystemShell.html
在Jetbrains的产品中,均可以安装插件,其中:Big Data Tools插件可以帮助我们方便的操作HDFS,比如
均可以支持Bigdata Tool插件。
需要对Windows系统做一些基础设置,配合插件使用
解压Hadoop安装包到Windows系统,如解压到:D:\hadoop-3.3.4
设置$HADOOP_HOME环境变量指向:D:\hadoop-3.3.4
下载
将hadoop.dll和winutils.exe放入$HADOOP_HOME/bin中
结束!!!!!!
hy:34
我们只需要活好今天,因为永恒由每个今天构成,每个今天都可以触摸永恒。