MengShi_

hadoop集群搭建--完全分布式

一、hadoop完全分布式

操作系统

软件要求

三、配置详情

1.安装虚拟机和配置网络

2. 上传jdk和hadoop

安装 VMware tools

设置共享文件夹

3. 安装jdk和hadoop

解压jdk和hadoop

创建软链接

4. 配置环境变量

配置hadoop配置文件

1.hadoop-env.sh

2.croe-site.xml

3.hdfs-site.xml

4.mapred-site.xml

5.yarn-site.xml

6.slaves

关闭防火墙

配置ssh无密登录

5.开始克隆虚拟机

6.初始化以及启动守护线程

7.结果验证

一、hadoop完全分布式

真正的分布式，由3个及以上的实体机或者虚拟机组成的机群。一个Hadoop集群环境中，NameNode，SecondaryName和DataNode是需要分配在不同的节点上，也就需要三台服务器。

前两种模式一般用在开发或测试环境下，生产环境下都是搭建完全分布式模式。

从分布式存储的角度来说，集群中的节点由一个NameNode和若干个DataNode组成，另有一个SecondaryNameNode作为NameNode的备份。

从分布式应用的角度来说，集群中的节点由一个JobTracker和若干个TaskTracker组成。JobTracker负责任务的调度，TaskTracker负责并行执行任务。TaskTracker必须运行在DataNode上，这样便于数据的本地计算。JobTracker和NameNode则无须在同一台机器上。

操作系统

w10+vmware

软件要求

jdk-8u172-linux-x64.tar 连接 https://pan.baidu.com/s/1yfkTu0p2y7sNee4qfq8e6A 密码:b9cr
hadoop-2.7.3.tar 链接：https://pan.baidu.com/s/1FAmed6G_JfrOfWjckaHbXg 提取码：h9zh
linux6.8

三、配置详情

1.安装虚拟机和配置网络

实际上单节点是不需要配置网络的。因为要从w10上将jdk和hadoop安装包上传至虚拟机。并且我这台机器需要继续配置伪分布以及完全分布。所以我需要配置网络环境。配置网络其实很简单。不需要的朋友也可以试着配置一下。linux还是很有意思的

我的虚拟机是由一个空白的安装了linux6.8桌面版复制而来。因此我需要修改虚拟机的mac地址。如果你的虚拟机是创建而来，那么可以跳过修改mac地址的步骤。网络使用nat模式。

sudo vim /etc/udev/rules.d/70-persistent-net.rules ----查看网卡信息以及记忆mac地址

# This file was automatically generated by the /lib/udev/write_net_rules
# program, run by the persistent-net-generator.rules rules file.
#
# You can modify it, as long as you keep each rule on a single
# line, and change only the value of the NAME= key.

# PCI device 0x8086:0x100f (e1000)
#SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:90:ab:e6", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"


----------将此处配置注释或删除 



# PCI device 0x8086:0x100f (e1000)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:b2:e7:66", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"


----------记住网卡mac地址 即00:0c:29:b2:e7:66  并将网卡名改为 eth0

2.sudo vim /etc/sysconfig/network-scripts/ifcfg-eth0 -----修改网卡配置文件

DEVICE=eth0
HWADDR=00:0C:29:B2:E7:66  ------将mac地址修改为刚才的mac地址
TYPE=Ethernet
UUID=c74cd800-bd98-4b84-9b67-821f3f8c14a1
ONBOOT=yes                -------将no改为yes 设置开机自动读取网络配置
NM_CONTROLLED=yes
BOOTPROTO=static          -------将dhcp改为static 设置为nat模式
IPADDR=192.168.61.70      -------添加ipaddr ip为vm8网卡同网段 查看方式vmware 编辑-虚拟网络编辑    
                                 器-vm8网卡-nat设置。 或者直接在window下ipconfig 查看vm8的ip
NETMASK=255.255.255.0     ------- 添加netmask 子网掩码 默认为255.255.255.0   
GATEWAY=192.168.61.2      -------添加gateway 默认网关 值为ip最后一位改为2
DNS1=192.168.61.2         -------添加 dns1  默认值何网关相同

3.修改主机名和域名映射(因为我之后要搭建一个三个节点的完全分布集群所以我的映射里面添加了三个从节点的ip)

sudo vim /etc/sysconfig/network -------修改主机名

NETWORKING=yes
HOSTNAME=Ms2   --------------将此处改为主机名

sudo vim /etc/hosts ---------修改主机映射

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.61.70 Ms2          --------------ip 主机名   可以忽略下面三条
192.168.61.71 sv1
192.168.61.72 sv2
192.168.61.73 sv3

注以上配置生效最好重启

2. 上传jdk和hadoop

安装 VMware tools

虚拟机->安装 VMware tools工具->解压缩压缩包到桌面->开启终端->切换root用户->执行可执行文件
->一路回车

设置共享文件夹

点击虚拟主机->设置->选项->共享文件夹-->启动-->选择window系统上要共享的文件夹（设置共享文件夹时需要重启）

3. 安装jdk和hadoop

首先验证网络配置即

[ms@Ms2 桌面]$ ping baidu.com
PING baidu.com (123.125.114.144) 56(84) bytes of data.
64 bytes from 123.125.114.144: icmp_seq=1 ttl=128 time=26.2 ms
64 bytes from 123.125.114.144: icmp_seq=2 ttl=128 time=25.7 ms
64 bytes from 123.125.114.144: icmp_seq=3 ttl=128 time=26.7 ms
64 bytes from 123.125.114.144: icmp_seq=4 ttl=128 time=25.8 ms
如果有数据传输即成功

解压jdk和hadoop

mkdir ~/apps -------在用户主目录下创建apps目录

cp /mnt/hgfs/1707/jdk-8u172-linux-x64.tar.gz ~/apps/ --------将共享文件夹中的jdk复制到 apps

cp /mnt/hgfs/1707/hadoop-2.7.3.tar.gz ~/apps/ --------将共享文件夹中的hadoop复制到 apps

tar -zvxf ~/apps/jdk-8u172-linux-x64.tar.gz ---------解压jdk

tar -zvxf ~/apps/hadoop-2.7.3.tar.gz ---------解压hadoop

创建软链接

创建软链接是为了更换软件时不需要修改环境变量

[ms@Ms2 apps]$ ln -s ~/apps/hadoop-2.7.3 hadoop -------创建hadoop的链接

[ms@Ms2 apps]$ ln -s ~/apps/jdk1.8.0_172 jdk -------创建jdk的软链接

4. 配置环境变量

[ms@Ms2 apps]$ vim ~/.bash_profile -------打开环境配置文件

specific environment and startup programs
PATH=$PATH:$HOME/bin
JAVA_HOME=/home/ms/apps/jdk -------jdk主目录
PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/jre/bin -------配置执行文件指向jdk
HADOOP_HOME=/home/ms/apps/hadoop -------hadoop主目录
PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin -------------配置执行文件指向hadoop
export PATH JAVA_HOME HADOOP_HOME -------设置自动加载

source ~/.bash_profile --------------读取配置文件

java ----------------测试jdk

用法: java [-options] class [args...]
(执行类)
或 java [-options] -jar jarfile [args...]
(执行 jar 文件)
其中选项包括:
-d32   使用 32 位数据模型 (如果可用)
-d64   使用 64 位数据模型 (如果可用)
-server   选择 "server" VM
默认 VM 是 server.

-cp <目录和 zip/jar 文件的类搜索路径>
-classpath <目录和 zip/jar 文件的类搜索路径>
用 : 分隔的目录, JAR 档案
和 ZIP 档案列表, 用于搜索类文件。
-D<名称>=<值>
设置系统属性
-verbose:[class|gc|jni]
启用详细输出
-version 输出产品版本并退出
-version:<值>
需要指定的版本才能运行
-showversion 输出产品版本并继续
-jre-restrict-search | -no-jre-restrict-search
在版本搜索中包括/排除用户专用 JRE
-? -help 输出此帮助消息
-X 输出非标准选项的帮助
-ea[:...|:]
-enableassertions[:...|:]
按指定的粒度启用断言
-da[:...|:]
-disableassertions[:...|:]
禁用具有指定粒度的断言
-esa | -enablesystemassertions
启用系统断言
-dsa | -disablesystemassertions
禁用系统断言
-agentlib:[=<选项>]
加载本机代理库 , 例如 -agentlib:hprof
另请参阅 -agentlib:jdwp=help 和 -agentlib:hprof=help
-agentpath:[=<选项>]
按完整路径名加载本机代理库
-javaagent:[=<选项>]
加载 Java 编程语言代理, 请参阅 java.lang.instrument
-splash:
使用指定的图像显示启动屏幕
有关详细信息, 请参阅 http://www.oracle.com/technetwork/java/javase/documentation/index.html。

hadoop ------------------测试hadoop

Usage: hadoop [--config confdir] [COMMAND | CLASSNAME]
CLASSNAME run the class named CLASSNAME
or
where COMMAND is one of:
fs run a generic filesystem user client
version print the version
jar run a jar file
note: please use "yarn jar" to launch
YARN applications, not this command.
checknative [-a|-h] check native hadoop and compression libraries availability
distcp copy file or directories recursively
archive -archiveName NAME -p * create a hadoop archive
classpath prints the class path needed to get the
credential interact with credential providers
Hadoop jar and the required libraries
daemonlog get/set the log level for each daemon
trace view and modify Hadoop tracing settings

Most commands print help when invoked w/o parameters

配置hadoop配置文件

1.hadoop-env.sh

[ms@Ms2 ~]$ vim ~/apps/hadoop/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/home/ms/apps/jdk ----------将此处修改为jdk路径

2.croe-site.xml

vim ~/apps/hadoop/etc/hadoop/core-site.xml

-----------------添加以下属性

        fs.defaultFS -----------------指定文件系统名称和post ，host
       hdfs://Ms2:9000


       hadoop.tmp.dir    ------------------用于指定datenode文件存储路径此目录需要手动创建
       file:/home/ms/apps/hadoop/tmp

3.hdfs-site.xml

vim ~/apps/hadoop/etc/hadoop/hdfs-site.xml

dfs.replication -------------------指定文件副本数
3

4.mapred-site.xml

此目录下没有该文件，我们需要将mapred-site.xml.template 复制一份，改成此名，然后再修改。

cp ~/apps/hadoop/etc/hadoop/mapred-site.xml.template ~/apps/hadoop/etc/hadoop/mapred-site.xml

mapreduce.framework.name -----------使用yarn运行框架
yarn

5.yarn-site.xml

vim ~/apps/hadoop/etc/hadoop/yarn-site.xml


            yarn.nodemanager.aux-services -------选择混洗技术
            mapreduce_shuffle


yarn.resourcemanager.hostname
Ms2 --------选择主机

6.slaves

vim ~/apps/hadoop/etc/hadoop/slaves

sv1 --------------选择数据节点。我要搭设三个从节点所以域名映射添加三台主机
sv2
sv3

关闭防火墙

[ms@Ms2桌面]$sudo chkconfig iptables off ------------永久关闭防火墙

[ms@Ms2 桌面]$ chkconfig iptables --list ------------查看防火墙状态

iptables 0:关闭 1:关闭 2:关闭 3:关闭 4:关闭 5:关闭 6:关闭 ------防火墙已关闭

配置ssh无密登录

ssh-keygen -t rsa ------------------一直回车

cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys --------------------将公钥发出

chmod 600 ~/.ssh/authorized_keys ---------------修改权限为600

ssh localhost ----测试ssh无密登录结果

Last login: Fri Mar 29 02:34:28 2019 from localhost

5.开始克隆虚拟机

因为我是准备搭建三个数据节点的集群主节点不设置为数据节点所以需要完全克隆三台虚拟机主机映射为

192.168.61.71 sv1
192.168.61.72 sv2
192.168.61.73 sv3

我们需要修改三台虚拟机此处只拿一天作为示范其他全部相同。读者自行配置。

[ms@Ms2 桌面]$ sudo /etc/udev/rules.d/70-persistent-net.rules 修改网卡设置

# PCI device 0x8086:0x100f (e1000)
#SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:b2:e7:66", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0" ------------------将此行注释或删除

# PCI device 0x8086:0x100f (e1000)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:01:df:ba", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0" ----------------将网卡mac地址记忆将eth1改为eth0

[ms@Ms2 桌面]$ sudo vim /etc/sysconfig/network-scripts/ifcfg-eth0
DEVICE=eth0
HWADDR=00:0C:29:01:DF:BA ----------------修改mac地址
TYPE=Ethernet
UUID=c74cd800-bd98-4b84-9b67-821f3f8c14a1
ONBOOT=yes
NM_CONTROLLED=yes
BOOTPROTO=static
IPADDR=192.168.61.71 --------------修改ip
NETMASK=255.255.255.0
GATEWAY=192.168.61.2
DNS1=192.168.61.2

[ms@Ms2 桌面]$ sudo vim /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=sv1 ------------------修改主机名

其他两台机器相同操作

6.初始化以及启动守护线程

初始化之前确保tmp目录下没有dfs 并且不是第一次ssh同从节点因为第一次ssh需要yes验证可能会连接不上

[ms@Ms2 桌面]$ ssh sv1 -------使用ssh向从节点发送请求第一次需要yes验证当主机名显示从节点即成功可以使用exit退出

[ms@sv1 ~]$ rm -rf ~/apps/hadoop/tmp/* ~/apps/hadoop/logs ---删除datenode节点数据否则初始化启动不了datenode守护进程

使用exit退出到主节点

初始化namenode进程(建议重启后)

[ms@Ms2 桌面]$ hdfs namenode -format

启动守护线程

[ms@Ms2 桌面]$ start-dfs.sh
Starting namenodes on [Ms1]
Ms1: starting namenode, logging to /home/ms/apps/hadoop-2.7.3/logs/hadoop-ms-namenode-Ms1.out
sv1: starting datanode, logging to /home/ms/apps/hadoop-2.7.3/logs/hadoop-ms-datanode-sv1.out
sv2: starting datanode, logging to /home/ms/apps/hadoop-2.7.3/logs/hadoop-ms-datanode-sv2.out
sv3: starting datanode, logging to /home/ms/apps/hadoop-2.7.3/logs/hadoop-ms-datanode-sv3.out
Starting secondary namenodes [0.0.0.0]
0.0.0.0: starting secondarynamenode, logging to /home/ms/apps/hadoop-2.7.3/logs/hadoop-ms-secondarynamenode-Ms1.out

查看主/从节点守护线程

[ms@Ms2 桌面]$ jps
3701 Jps
3368 NameNode
3544 SecondaryNameNode

[ms@sv1 桌面]$ jps
3380 Jps
2829 DataNode

7.结果验证

可以使用虚拟机自带火狐浏览器输入Ms2：50070进入hadoopweb界面。或者使用ip从window也可以即192.168.61.70

可以看到三个数据节点都已启动成功。下面就可以操作hdfs分布式文件系统。具体操作和启动流程原理我们下篇会说到

Ubuntu下部署Hadoop集群+Hive（二）岩屿 hadoop hive
Hadoop集群搭建准备环境hadoop-3.3.6.tar.gz，jdk-8u421-linux-x64.tar.gz根据自己的使用下载对的hadoop和jdk版本hadoop下载地址：ApacheHadoopJDK下载地址：JavaDownloads|Oracle在3台服务器上的/opt/目录下新建module和software文件夹，其中software文件夹用来存放软件包，module用来
docker搭建hadoop hdfs完全分布式集群 shangcunshanfu hadoop docker big data
1制作hadoop镜像参见https://www.cnblogs.com/rmxd/p/12051866.html该博客中只参考制作镜像部分，固定IP及启动集群的部分应该跳过。这里注意，在做好的镜像里，要安装which工具，否则在执行hdfs命令时会报命令不存在异常。yuminstallwhich-y2启动容器dockerrun--namehmaster--hostnamehmaster--net
Hadoop手把手逐级搭建第二阶段: Hadoop完全分布式(full) 郑大能
前置步骤:1).第一阶段：Hadoop单机伪分布(single)0.步骤概述1).克隆4台虚拟机2).为完全分布式配置ssh免密3).将hadoop配置修改为完全分布式4).启动完全分布式集群5).在完全分布式集群上测试wordcount程序1.克隆4台虚拟机1.1使用hadoop0克隆4台虚拟机hadoop1,hadoop2,hadoop3,hadoop41.1.0克隆虚拟机hadoop11.1
2018-11-16 hadoop3.1完全分布式部署 Albert陈凯
Hadoop3.1.0完全分布式集群部署，三台服务器部署结构如下github配置文件源码地址Pdsh使用方法http://kumu-linux.github.io/blog/2013/06/19/pdsh/http://blog.51cto.com/ixdba/1550184
Git学习星石传说其它 git 学习 elasticsearch
Git学习文章目录前言一、Git是什么二、安装三、工作流程总结前言一、Git是什么Git是一个开源的分布式版本控制系统，用于敏捷高效地处理任何或小或大的项目。特点：速度简单的设计对非线性开发模式的强力支持（允许上千个并行开发的分支）完全分布式有能力高效管理类似Linux内核一样的超大规模项目（速度和数据量）二、安装Git各平台安装包下载地址为：http://git-scm.com/download
Hadoop搭建（完全分布式）莫噶搭建分布式 hadoop 大数据
节点分布：bigdata-masterbigdata-slave1bigdata-salve2NameNodeNodeManagerNodeManagerSecondaryNameNodeDataNodeDataNodeResourceManagerNodeManagerDataNode目录一、jdk安装：二、hadoop安装一、jdk安装：jdk-8u212链接：https://pan.baid
Hadoop | 集群配置（一）使用Shell脚本解决完全分布式集群节点之间的文件传输问题 | scp命令 | rsync命令「已注销」 #大数据原理与应用 hadoop 分布式 linux
文章目录参考资料一、前言二、rsync远程同步工具三、使用shell编写分发脚本四、总结参考资料视频链接Linuxscp命令一、前言在Hadoop完全分布式集群环境下，里面的各个节点都是通过SSH免密登陆连接的，比如现有三台集群节点，分别是hadoop101、hadoop102、hadoo103。hadoop101节点可以通过ssh命令连接到hadoop102，即：sshhadoop102那么，除
hadoop集群搭建踩坑实录温文尔雅的流氓 Hadoop
由于不可控以及不可知的原因我搭建的hadoop集群突然显示虚拟机出现了问题导致某一个DataNode数据丢失并且无法通过Xshell远程访问其他的DataNode主机和虚拟机无法互相ping通网上能找的解决办法基本都找了依然无法解决因此我能想到的是只能删除虚拟机重新克隆一台机器然而还是无法通过远程连接无奈之下我重启电脑发现又可以通过Xshell远程访问了具体原因尚不知晓克隆成功后发现集群先格式化集
6.Linux虚拟机下的Hadoop集群搭建之完全分布式配置学习BigData 关于Hadoop的学习笔记 hadoop 分布式 linux
Hadoop及相关组件搭建指导WeChat：h19396218469hadoop-3.1.3jdk-8u162-linux-x64本案例软件包：链接：https://pan.baidu.com/s/1ighxbTNAWqobGpsX0qkD8w提取码：lkjh（若链接失效在下面评论，我会及时更新）一、配置Hadoop集群主节点1.进入目标文件夹。cd/usr/local/hadoop/etc/ha
4.Linux虚拟机下的Hadoop集群搭建之Xshell及Xftp的使用和SSH服务配置学习BigData 关于Hadoop的学习笔记 linux hadoop ssh
Hadoop及相关组件搭建指导WeChat：h19396218469本案例软件包：链接：https://pan.baidu.com/s/1ighxbTNAWqobGpsX0qkD8w提取码：lkjh（若链接失效在下面评论，我会及时更新）一、Xshell和Xftp的使用在这里我们首先要了解两个软件，一个是Xshell另一个是Xftp。1.Xshell是一个强大的安全终端模拟软件，它支持SSH1,SS
Flink1.18.0集成Yarn-session模式部署 china-zhz flink yarn hadoop 大数据
上次部署了Hadoop集群Hadoop3.3.6（HDFS、YARN、MapReduce）完全分布式集群安装搭建这次集成下flinkYARN上部署的过程是：客户端把Flink应用提交给Yarn的ResourceManager,Yarn的ResourceManager会向Yarn的NodeManager申请容器。在这些容器上，Flink会部署JobManager和TaskManager的实例，从而启
Hadoop3.3.6（HDFS、YARN、MapReduce）完全分布式集群安装搭建 china-zhz hdfs mapreduce hadoop yarn
目录一、节点部署角色目录二、下载软件三、基础设施1、安装必要插件2、设置IP及主机名3、时间同步4、jdk安装5、ssh免密登录四、Hadoop部署1、目录及环境变量准备2、安装3、修改配置文件4、分发文件5、启动hadoop集群6、集群部署验证一、节点部署角色目录节点ipNNSNNDNRMNMHSnode1192.168.88.11√√node2192.168.88.12√√√√node3192
Hadoop集群搭建终将老去的穷苦程序员 hadoop
搭建Hadoop集群涉及多个步骤，包括准备硬件环境、安装和配置Hadoop以及验证集群的安装。以下是一个基本的Hadoop集群搭建流程，假设你已经有了一些基础的Linux操作系统知识，并且准备在多台机器上搭建一个简单的Hadoop集群。1.系统环境准备硬件要求：至少需要两台或更多的计算机，一台作为Master节点，其余的作为Worker节点。操作系统：确保所有节点上安装了Linux操作系统，如Ub
[绝对要收藏]配置hadoop完全分布式环境 Java小白中的菜鸟 centos7 hadoop 分布式 hdfs
##环境：hadoop-2.7.2，jdk1.8.0_144，CentOS-7-x86_64-Minimal-2009.iso1先创建一个主机2修改id，hostname，hosts3关闭防火墙4连接xshell5在opt下创建en和software包并将java导入到software包中6解压java到en下7配置/etc/profile将java的环境加入进去8让文件生效并检测java环境是否
用户行为数据采集日月交辉数仓DW hive 大数据
Flume——Hadoop——VMVM环境准备安装JDK安装HadoopHadoop运行模式本地模式伪分布式完全分布式集群启动组件逐一启动。模块启动
Hadoop3.x学习笔记魅Lemon 大数据 hadoop
文章目录一、Hadoop入门1、Hadoop概述1.1简介1.2hadoop优势1.3hadoop组成1.4大数据技术生态体系2、环境准备(重点)2.1模板机配置2.2模板创建3、本地运行模式（官方WordCount）4、Hadoop集群搭建(重点)4.1环境准备(集群分发脚本xsync)4.2SSH免密配置4.3集群配置4.4启动集群4.5配置历史服务器4.6配置日志的聚集4.7集群启动/停止方
Spark完全分布式集群下的Hive的安装和配置-安装步骤 Deng872347348 Hadoop Hive hive 大数据
Spark完全分布式集群下的Hive的安装和配置-安装步骤：文章目录Spark完全分布式集群下的Hive的安装和配置-安装步骤：2.安装MySQL数据库3.配置MySQL相关5.设置环境变量6.修改hive配置文件7.上传MySQL连接驱动8.初始化元数据9.启动HiveSparkSQL操作Hive数据库2.安装MySQL数据库安装mysql先检查系统是否装有mysqlrpm-qa|grepmys
Hadoop3完全分布式搭建三木一立大数据分布式 php 开发语言
一、第一台的操作搭建修改主机名使用hostnamectlset-hostname修改当前主机名关闭防火墙和SELlinux1，使用systemctlstopfirewalldsystemctldisablefirewalld关闭防火墙2，使用vim/etc/selinux/config修改为SELINUX=disabled使用NAT模式配置静态IP1，修改网络配置vim/etc/sysconfig
linux 部署Hadoop完全分布式集群教程 qq_61247494 hadoop 分布式 linux
一、准备工作1、本次任务需要三台虚拟机，主机名分别为Master、Slave01、Slave02先在Master上安装好jdk和Hadoop（安装教程可以参考这两篇文章）然后为了简便我们直接克隆两台Master来配置成为Slave01、Slave02；2、把克隆的虚拟机名字改为Slave01、Slave02二、配置IP与密钥1、分别在三台虚拟机上的root下输入命令vi/etc/sysconfig
HBase集群部署 Golden life hbase 数据库大数据
前提条件安装hbse的前提条件是jdk已经搭建完成，虚拟机具有Hadoop伪分布式或完全分布式的集群搭建，以及zookeeper环境搭建完成。HBase安装在虚拟机上上传已经下载好的HBase安装包(官网下载需要的版本，我这里是2.2.3)，使用finalshell上传至虚拟机的目录下，我这里是/opt/software文件夹下使用tar命令参数：-xvzf解压时注意压缩包的名字及指定目录自己要记
MARL——多智能体强化学习特点与架构总结 LENG_Lingliang Python与强化学习架构学习
1.特点概述1）多智能体系统中，每个agent未必能观测到所有的状态信息，此时智能体i得到的观测oio^{i}oi通常不等于状态SSS。2）智能体动作选择互相影响。3）需要通信机制。2.3种框架完全分布式这种算法框架和单智能体强化学习一样，每个个体都根据自身观测进行训练学习。个体之间没有交流。这种效果通常不好，因为没有考虑智能体动作选择互相影响的关系。集中式训练，集中式执行（完全集中式）存在一种中
Zookeeper+Hadoop+Spark+Flink+Kafka+Hbase+Hive nsa65223 hadoop zookeeper spark
说明Zookeeper+Hadoop+Spark+Flink+Kafka+Hbase+Hive完全分布式高可用集群搭建下载https://archive.apache.org/dist/我最终选择Zookeeper3.7.1+Hadoop3.3.5+Spark-3.2.4+Flink-1.16.1+Kafka2.12-3.4.0+HBase2.4.17+Hive3.1.3+JDK1.8.0_391
Spark完全分布式集群搭建小猪Harry
环境准备服务器集群我用的CentOS-6.6版本的4个虚拟机，主机名为hadoop01、hadoop02、hadoop03、hadoop04，另外我会使用hadoop用户搭建集群(生产环境中root用户不是可以任意使用的)spark安装包下载地址：https://mirrors.aliyun.com/apache/spark/我用的spark-2.2.0-bin-hadoop2.7.tgz要根据自
Hadoop集群搭建：4.修改Hadoop的配置文件、节点启动丶珍视当下
配置文件的路径：/module/hadoop-2.7.2/etc/hadoop1.核心配置文件配置core-site.xml,命令：vicore-site.xml在该文件的中config范围内编写如下配置fs.defaultFShdfs://node1:9000hadoop.tmp.dir/module/hadoop-2.7.2/data/tmpcore-site.xml2.HDFS配置文件配置h
hadoop集群搭建、spark集群搭建、pyspark搭建（linux+window） Lfx_come on hadoop linux spark python
1、前言本文记录学习过程中Hadoop、zookeeper、spark集群搭建，主要为pyspark库服务（具体为window上pyspark环境和pyspark库，linux上spark框架、pyspark应用程序、pyspark环境和pyspark库）。pyspark环境是用anaconda3搭建的环境。pyspark应用程序，是安装spark集群里面自带的，提供一个python解释器环境来执
[Introducing Ethereum and Solidity]以太坊和solidity介绍----第一章-连接区块链知识的断点智能合约学习记录区块链以太坊 Solidity 智能合约
1连接区块链知识的断点为高速发展的区块链世界的欢呼是具有挑战的。这本书将会是你的指引。在开始之前，让我们定义一下之后将要用到的一些术语。“区块链”是一种完全分布式的，点对点的软件网络，这个软件网络利用加密学来安全地群集应用软件，储存数据，简单地传输用于代表真实世界金钱的数字化工具。加密学是一个通过编码信息来进行的交流艺术。在比特币和以太坊中，加密学是用来给成千上万个相似的机器创造出来一种安全运算环
2024任务驱动Hadoop应用讲课提纲 howard2005 Hadoop分布式入门 hadoop 大数据分布式
文章目录为何采用任务驱动？任务驱动Hadoop应用课程概述项目一：搭建Hadoop集群任务1：搭建完全分布式Hadoop集群1.思路解析2.编程实现3.知识点讲解4.总结提高任务2：搭建高可用Hadoop集群（HA模式）1.思路解析2.编程实现3.知识点讲解4.总结提高项目二：HDFS操作实践任务1：使用HDFSShell命令行操作1.思路解析2.编程实现3.知识点讲解4.总结提高任务2：通过Ja
Zookeeper集群搭建 WE-ubytt 大数据处理与应用 zookeeper hadoop 大数据
系列文章目录Ubuntu常见基本问题Hadoop3.1.3安装（单机、伪分布）Hadoop集群搭建HBase2.2.2安装（单机、伪分布）Zookeeper集群搭建HBase集群搭建Spark安装和编程实践（Spark2.4.0）Spark集群搭建文章目录系列文章目录一、安装Zookeeper二、集群搭建1、修改配置文件①zoo.cfg②myid2、分发目录3、启动一、安装Zookeeper先把压
Hadoop完全分布式搭建 - 第二章 CentOS集群安装配置 Dehan.Dan
CentOS7.6.1080一些其他博主的参考+原创一、准备工作将安装好的CentOS7克隆多两台出来关闭防火墙：systemctlstopfirewalld.service禁用防火墙：systemctldisablefirewalld.service查看防火墙状态firewall-cmd--state重启reboot二、实现三台机器ssh免密登录前提：确保三台机的名称与IP1.修改IP(设置为手
CentOS系统部署Hadoop完全分布式集群 ScriptFlying Hadoop平台
查看当前使用的CentOS版本及JDK、Hadoop版本，结果如下截图：Hadoop全分布部署与伪分布的单机部分完全相同，唯有hadoop的文件配置略有不同，本文建立在伪分布部署的基础上重新修改配置文件，伪分布部署可见文档博文CentOS系统部署Hadoop伪分布模一、配置主节点master前提：有已建好的单机环境，或伪分布环境也可1、修改主机名[root@cMasterhadoop]#vim/e
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

hadoop集群搭建--完全分布式

一、hadoop完全分布式

操作系统

软件要求

三、配置详情

1.安装虚拟机和配置网络

2. 上传jdk和hadoop

安装 VMware tools

设置共享文件夹

3. 安装jdk和hadoop

解压jdk和hadoop

创建软链接

4. 配置环境变量

配置hadoop配置文件

1.hadoop-env.sh

2.croe-site.xml

3.hdfs-site.xml

4.mapred-site.xml

5.yarn-site.xml

6.slaves

关闭防火墙

配置ssh无密登录

5.开始克隆虚拟机

6.初始化以及启动守护线程

7.结果验证

你可能感兴趣的:(hadoop集群搭建--完全分布式)