一、Hadoop的本地部署使用
1.首先要有包含内容的文件
在/opt下面创建一个目录(文件夹)test命令:
cd /opt
mkdir test
在/opt/test目录下面创建input目录(文件夹)和output目录(文件夹命令:
mkdir input
mkdir output
2.用hadoop去执行这个文件
切换到
/opt/module/hadoop-3.1.3/share/hadoop/mapreduce
执行文件:
hadoop jar hadoop-mapreduce-examples-3.1.3.jar wordcount /opt/test/input/ /opt/test/output/count.txt
3.查看执行后的结果
命令:cd /opt/test/output/count.txt
命令:cat part-r-00000
二、Hadoop的伪分布式部署
1.配置集群环境
(1)修改一个配置
在/opt/module/hadoop-3.1.3/etc/hadoop目录下
设置hadoop-env.sh文件
vi hadoop-env.sh
命令模式下输入/搜索JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_212
(2)配置core-site.xml
在/opt/module/hadoop-3.1.3/etc/hadoop目录下
设置core-site.xml文件
vi core-site.xml
fs.defaultFS
hdfs://hadoop1000:9820
hadoop.data.dir
/opt/module/hadoop-3.1.3/data
(3)HDFS配置文件
在/opt/module/hadoop-3.1.3/etc/hadoop目录下
设置hdfs-site.xml文件
vi hdfs-site.xml
在configuration中指定HDFS的数量
dfs.replication
1
(4)YARN配置文件
配置yarn-site.xml
vi yarn-site.xml
文件内容如下:
yarn.nodemanager.aux-services
mapreduce_shuffle
yarn.resourcemanager.hostname
hadoop101
yarn.nodemanager.env-whitelist
JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME
(5)MapReduce配置文件
配置mapred-site.xml
vi mapred-site.xml
文件内容如下:
mapreduce.framework.name
yarn
2.启动集群
(1)格式化namenode命令:
hdfs namenode -format
(2)启动namenode命令:
hdfs --daemon start namenode
(3)启动dataNode命令:
hdfs --daemon start namenode
(4)启动resourcemanager命令:
yarn --daemon start resourcemanager
(5)启动nademanager命令:
yarn --daemon start nademanager
如果出现进程启动不起来
在/opt/module/hadoop3.1.3/有logs文件夹
哪个命令启动不起来,就查看logs文件夹中的相对应的log文件
总结
一.配置集群
二.100 101 102
Namenode
hdfs --daemon start namenode
hdfs --daemon start datanode
yarn --daemon start resourcemanager
yarn --daemon start nademanager
1.切换路径 cd /opt/module/hadoop-3.1.3/etc/hadoop/
2.查看 ll
3.vi hadoop-env.sh
4.vi core-site.xml
5.vi hdfs-site.xml
6.vi yarn-site.xml
7.vi mapred-site.xml