guojianrui

hadoop1.2.1+zk-3.4.4+hbase-0.94.12集群安装

hadoop1.2.1+zk-3.4.4+hbase-0.94.12集群安装

系统环境：

CentOS release 6.3 (Final)

软件版本：

hadoop1.2.1

zk-3.4.4

hbase-0.94.12

主机规划：

集群中包括3个节点：hadoop01为Master，其余为Salve，节点之间局域网连接，可以相互ping通

IP地址	节点名
192.168.1.138	hadoop01
192.168.1.139	hadoop02
192.168.1.140	hadoop03

三个节点上均是CentOS6.3 x86_64系统，并且有一个相同的用户hadoop。hadoop01做为master配置NameNode和JobTracker的角色，负责总管分布式数据和分解任务的执行；另外两台配置DataNode和TaskTracker的角色，负责分布式数据存储以及任务的执行。安装目录统一为/usr/local下

二，准备工作，三台机器都需要做，将三台机器selinux，iptables停用。

1，安装jdk (jdk版本：jdk-7u25-linux-x64.rpm)

# ln -s jdk1.7.0_25 jdk 做软连接

# vim /etc/profile 配置java环境变量

export JAVA_HOME=/usr/java/jdk

export JAVA_BIN=/usr/java/jdk/bin

export PATH=$PATH:$JAVA_HOME/bin

export CLASSPATH=$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOME JAVA_BIN PATH CLASSPAT

# source /etc/profile 让其java命令立即生效

2、做三台机器之间做双机互信，原因master通过远程启动datanode进程和tasktracker进程，如果不做双机互信，会导致每次启动集群服务都会需要密码

# vim /etc/hosts

192.168.1.138   hadoop01

192.168.1.139   hadoop02

192.168.1.140   hadoop03

将hosts文件分别复制到另外两台。

3、切换到hadoop用户，对其用做双机互信，先在三台机器先执行ssh-keygen生成公钥与私钥

[root@hadoop01 ~]# ssh-copy-id -i hadoop02

[root@hadoop01 ~]# ssh-copy-id -i hadoop03

[root@hadoop02 ~]# ssh-copy-id -i hadoop01

[root@hadoop02 ~]# ssh-copy-id -i hadoop03

[root@hadoop03 ~]# ssh-copy-id -i hadoop01

[root@hadoop03 ~]# ssh-copy-id -i hadoop02

ssh-copy-id: command not found 解决办法：
yum install openssh-clients -y

4、同步时间，三台机器启用ntpd服务，另外两台执行相同的操作

[root@hadoop01 ~]# crontab -e

*/5 * * * * /usr/sbin/ntpdate ntp.api.bz &> /dev/null

三，配置master，也就hadoop01

[root@hadoop01 ~]# tar xf hadoop-1.2.1.tar.gz -C /usr/local/

修改hadoop-env.sh

# export JAVA_HOME=/usr/lib/j2sdk1.5-sun

export JAVA_HOME=/usr/java/jdk

修改core-site.xml

<configuration>
<property>
        <name>hadoop.tmp.dir</name>
        <value>/data/hadoop/tmp</value>
</property>
<property>
        <name>fs.default.name</name>
        <value>hdfs://hadoop01:9000</value>
</property>
</configuration>

hadoop.tmp.dir属性用于定义Hadoop的临时目录，其默认为/tmp/hadoop-${username}。HDFS进程的许多目录默认都在此目录中，/hadoop/tmp目录，需要注意的是，要保证运行Hadoop进程的用户对其具有全部访问权限。

fs.default.name属性用于定义HDFS的名称节点和其默认的文件系统，其值是一个URI，即NameNode的RPC服务器监听的地址(可以是主机名)和端口(默认为8020)。其默认值为file:///，即本地文件系统。

修改hdfs-site.xml文件

# vim conf/hdfs-site.xml

<configuration>
        <property>
                <name>dfs.data.dir</name>
                 <value>/data/hadoop/data</value>
         </property>
         <property>
                <name>dfs.replication</name>
                <value>2</value>
         </property>
</configuration>

dfs.name.dir属性定义的HDFS元数据持久存储路径,默认为${hadoop.tmp.dir}/dfs/name

dfs.replication属性定义保存副本的数量，默认是保存3份,由于这里只有两台slave。所以设置2。

修改mapred-site.xml文件

# vim conf/mapred-site.xml

<configuration>
        <property>
                <name>mapred.job.tracker</name>
                <value>http://hadoop01:9001</value>
         </property>
</configuration>

编辑masters文件

masters用于指定，辅助名称节点(SecondaryNameNode)的主机名或主机地址

[hadoop@hadoop01 hadoop-1.2.1]$ vim conf/masters

hadoop01

编辑slaves文件，这个文件只需在master主机上编辑就行

用于指定各从服务器(TaskTracker或DataNode)的主机名或主机地址

hadoop02

hadoop03

在三台机器上分别创建两个目录：

# mkdir -p /hadoop/data

# mkdir -p /hadoop/tmp

配置slave：将配置的hadoop整个目录复制到hadoop02，hadoop03

# scp -rp /usr/local/hadoop-1.2.1 hadoop02:/usr/local/

# scp -rp /usr/local/hadoop-1.2.1 hadoop03:/usr/local/

四，启动集群：

1、格式化名称节点

与普通文件系统一样，HDFS文件系统必须要先格式化，创建元数据数据结构以后才能使用。

＃　bin/hadoop namenode -format

＃　bin/start-all.sh

＃　jps 查看进程是否起来。secondarynamenode，nomenode，jobtracker三个进程必须都有，才正常。

8549 SecondaryNameNode

8409 NameNode

8611 JobTracker

8986 Jps

或者这种方式查看集群是否正常

[hadoop@hadoop01 hadoop-1.2.1]$ bin/hadoop dfsadmin -report

Safe mode is ON

Configured Capacity: 37073182720 (34.53 GB)

Present Capacity: 32421658624 (30.2 GB)

DFS Remaining: 32421576704 (30.19 GB)

DFS Used: 81920 (80 KB)

DFS Used%: 0%

Under replicated blocks: 0

Blocks with corrupt replicas: 0

Missing blocks: 0

-------------------------------------------------

Datanodes available: 2 (2 total, 0 dead)

Name: 192.168.0.33:50010

Decommission Status : Normal

Configured Capacity: 18536591360 (17.26 GB)

DFS Used: 40960 (40 KB)

Non DFS Used: 2325061632 (2.17 GB)

DFS Remaining: 16211488768(15.1 GB)

DFS Used%: 0%

DFS Remaining%: 87.46%

Last contact: Sat Aug 31 22:25:13 CST 2013

Name: 192.168.0.32:50010

Decommission Status : Normal

Configured Capacity: 18536591360 (17.26 GB)

DFS Used: 40960 (40 KB)

Non DFS Used: 2326462464 (2.17 GB)

DFS Remaining: 16210087936(15.1 GB)

DFS Used%: 0%

DFS Remaining%: 87.45%

Last contact: Sat Aug 31 22:25:12 CST 2013

测试集群：

＃ bin/hadoop jar hadoop-test-1.2.1.jar DFSCIOTest -write -nrFiles 10 -filesize 1000

＃ bin/hadoop jar hadoop-test-1.2.1.jar DFSCIOTest -read -nrFiles 10 -filesize 1000

hadoop默认监听的端口：

Hadoop进程监听的地址和端口

Hadoop启动时会运行两个服务器进程，一个为用于Hadoop各进程之间进行通信的RPC服务器，另一个是提供了便于管理员查看Hadoop集群各进程相关信息页面的HTTP服务器。

可用于定义各HTTP服务器的属性有如下几个：

dfs.http.address：NameNode的HTTP服务器地址和端口，默认为0.0.0.0:50070；

dfs.secondary.http.address：SecondaryNameNode的HTTP服务器地址和端口，默认为0.0.0.0:50090；

mapred.job.tracker.http.addrss：JobTracker的HTTP服务器地址和端口，默认为0.0.0.0:50030；

dfs.datanode.http.address：DataNode的HTTP服务器地址和端口，默认为0.0.0.0:50075；

mapred.task.tracker.http.address：TaskTracker的HTTP服务器地址和端口，默认为0.0.0.0:50060；上述的HTTP服务器均可以通过浏览器直接访问以获取对应进程的相关信息，访问路径为http://Server_IP:Port。如namenode的相关信息：

四，排错思路

1，是否是hadoop.tmp.dir，dfs.data.dir属性，如果定义在别的目录需要在集群中所有节点都创建，并让hadoop用户能够访问

2，查看进程对应的端口是否有在监听。在上面配置中将namenode的端口定义9000，jobtracker定义成9001

[hadoop@hadoop01 hadoop-1.2.1]$ netstat -tunlp |grep 9000

tcp 0 0 ::ffff:192.168.0.31:9000 :::* LISTEN 22709/java

[hadoop@hadoop01 hadoop-1.2.1]$ netstat -tunlp |grep 9001

tcp 0 0 ::ffff:192.168.0.31:9001 :::* LISTEN 22924/java

3，查看日志，哪个服务没起来就查看对应的日志。

4，查看集群中所有节点的时间是不是一致。

5，iptable与selinux是否阻止。

6，/etc/hosts是否正确。

五，添加节点，删除节点

添加节点
1.修改host
和普通的datanode一样。添加namenode的ip
2.修改namenode的配置文件conf/slaves
添加新增节点的ip或host
3.在新节点的机器上，启动服务

[hadoop@hadoop04 hadoop]# ./bin/hadoop-daemon.sh start datanode
[hadoop@hadoop04 hadoop]# ./bin/hadoop-daemon.sh start tasktracker

4.均衡block

[hadoop@hadoop04 hadoop]# ./bin/start-balancer.sh
1）如果不balance，那么cluster会把新的数据都存放在新的node上，这样会降低mapred的工作效率
2）设置平衡阈值，默认是10%，值越低各节点越平衡，但消耗时间也更长

[root@slave-004 hadoop]# ./bin/start-balancer.sh -threshold 5

3）设置balance的带宽，默认只有1M/s

<property>
<name>dfs.balance.bandwidthPerSec</name>
<value>1048576</value>
<description>

Specifies the maximum amount of bandwidth that each datanode
can utilize for the balancing purpose in term of
the number of bytes per second.
</description>
</property>

注意：
1. 必须确保slave的firewall已关闭;
2. 确保新的slave的ip已经添加到master及其他slaves的/etc/hosts中，反之也要将master及其他slave的ip添加到新的slave的/etc/hosts中

删除节点

1.集群配置
修改conf/hdfs-site.xml文件

<property>
<name>dfs.hosts.exclude</name>
<value>/data/soft/hadoop/conf/excludes</value>
<description>Names a file that contains a list of hosts that are
not permitted to connect to the namenode. The full pathname of the
file must be specified. If the value is empty, no hosts are
excluded.</description>
</property>
2确定要下架的机器
dfs.hosts.exclude定义的文件内容为,每个需要下线的机器，一行一个。这个将阻止他们去连接Namenode。如：

haoop04
3.强制重新加载配置

[root@master hadoop]# ./bin/hadoop dfsadmin -refreshNodes

它会在后台进行Block块的移动
4.关闭节点
等待刚刚的操作结束后，需要下架的机器就可以安全的关闭了。

[root@master hadoop]# ./bin/ hadoop dfsadmin -report

可以查看到现在集群上连接的节点

正在执行Decommission，会显示：
Decommission Status : Decommission in progress
执行完毕后，会显示：
Decommission Status : Decommissioned
5.再次编辑excludes文件
一旦完成了机器下架，它们就可以从excludes文件移除了
登录要下架的机器，会发现DataNode进程没有了，但是TaskTracker依然存在，需要手工处理一下

六，安装zookeeper:

1，zookeeper概述：

ZooKeeper是一个分布式开源框架，提供了协调分布式应用的基本服务，它向外部应用暴露一组通用服务――分布式同步（Distributed Synchronization）、命名服务（Naming Service）、集群维护（Group Maintenance）等，简化分布式应用协调及其管理的难度，提供高性能的分布式服务。ZooKeeper本身可以以Standalone模式安装运行，不过它的长处在于通过分布式ZooKeeper集群（一个Leader，多个Follower），基于一定的策略来保证ZooKeeper集群的稳定性和可用性，从而实现分布式应用的可靠性。

hadoop01为zookeeper1，hadoop02为zookeeper2，hadoop03为zookeeper3

2、下载zookeeper-3.4.4解压到/usr/local/下，并修改权限

# vim conf/zoo.cfg

dataDir=/hadoop/zookeeper
# the port at which the clients will connect
clientPort=2181
server.1=hadoop01:28888:38888
server.2=hadoop02:28888:38888
server.3=hadoop03:28888:38888

注解：

tickTime发送心跳时间间隔，单位毫秒

initlimit和sysnclimit，两者都是以ticktime的总数进行度量(上面的时间为10*2000=20s)。initLimit参数设定了允许所有跟随者与领导者进行连接并同步的时间，如果在设定的时间内内，半数以上的跟随者未能完成同步，领导者便会宣布放弃领导地位，然后进行另外一次领导者选举。如果这种情况经常发生，通过查看日志中的记录发现，则表明设定的值太小。

syscLimit参数设定了允许一个跟随者与领导者进行同步的时间。如果在设定的时间内，一个跟随者未能完成同步，它将会自己重启，所有关联到这个跟随者的客户端将连接到另外一个跟随者。

datadir保存的zk中持久化的数据，zk中存在两种数据，一种用完即消失，一种需要持久存在，zk的日志也保存在这

# mkdir /hadoop/zookeeper/

# echo "1" > /hadoop/zookeerper/myid

hadoop02，hadoop03 相应的节点创建myid

在对应的节点上启动服务

[hadoop01 zookeeper-3.4.4]$ sh bin/zkServer.sh start

三个节点启动完之后，查看

[hadoop01 zookeeper-3.4.4]$ jps

1320 NameNode

2064 Jps

1549 JobTracker

1467 SecondaryNameNode

1996 QuorumPeerMain

[hadoop@hadoop01 zookeeper-3.4.4]$ sh bin/zkServer.sh status 查看当前节点是否是leader

[hadoop@hadoop01 zookeeper-3.4.4]$ sh bin/zkServer.sh status

JMX enabled by default

Using config: /usr/local/zookeeper-3.4.4/bin/../conf/zoo.cfg

Mode: follower 表示是跟从

参考文档：

http://smalldeng.blog.51cto.com/1038075/1329290

http://qindongliang.iteye.com/blog/1977053

Kafka2.8.0集群安装教程请叫我你好安装教程 kafka
Kafka2.8.0集群安装教程准备工作node01~node04（四个节点机器，三台也可以），kafka安装node01~~node03启动zookeeper，这里依次启动node131，node132，node133上的zk。（关于zookeeper集群安装请看https://blog.csdn.net/qq_41578037/article/details/123809220）[root@n
大数据系列 | Kafka架构分析及应用降世神童大数据技术专栏大数据 kafka 架构
大数据系列|Kafka架构分析及应用1.消息系统介绍2.Kafka原理分析3.Kafka架构分析4.Kafka的安装与配置4.1.Zookeeper集群安装配置4.2.安装Kafka集群4.3.配置kafka自启动服务5.kafka生产者和消费者的应用5.1.生产者使用5.2.消费者使用6.KafkaController控制器1.消息系统介绍常用消息系统对比： ■RabbitMQ：Erlan
zookeeper分布式锁案例 shuair zookeeper 分布式 zookeeper 云原生
zookeeper分布式锁案例文档linux安装java-centos安装java-linux配置java环境变量zookeeper单机安装zookeeper集群安装zookeeper客户端命令行操作、节点类型及监听器zookeeper集群写数据原理java操作zookeeper手写分布式锁案例原理线程获取锁时，在/locks节点下创建临时有序号节点，需要注意的是，有序号的节点序号是递增的crea
学习笔记六：ceph介绍以及初始化配置风车带走过往 K8S相关应用学习笔记 ceph
k8s对接cephceph是一种开源的分布式的存储系统，包含以下几种存储类型：块存储（rbd）文件系统cephfs对象存储分布式存储的优点：Ceph核心组件介绍安装Ceph集群初始化配置Ceph安装源安装基础软件包安装ceph集群安装ceph-deploy创建monitor节点修改ceph配置文件配置初始monitor、收集所有的密钥部署osd服务创建ceph文件系统ceph是一种开源的分布式的存
[java][集群]consul集群安装 awonw java java-consul java consul
/usr/local/bin/consulagent-server-data-dir=/tmp/consul-node=server-1-bind=192.168.3.110-bootstrap-expect3-client=0.0.0.0-ui/usr/local/bin/consulagent-server-data-dir=/tmp/consul-node=server-2-bind=192
java操作zookeeper shuair zookeeper zookeeper
java操作zookeeper文档linux安装java-centos安装java-linux配置java环境变量zookeeper单机安装zookeeper集群安装zookeeper客户端命令行操作、节点类型及监听器zookeeper集群写数据原理java操作zookeeper依赖信息junitjunittestorg.apache.logging.log4jlog4j-core2.8.2org
zookeeper单机安装 shuair zookeeper zookeeper java
zookeeper单机安装文档linux安装java-centos安装java-linux配置java环境变量zookeeper单机安装zookeeper集群安装zookeeper客户端命令行操作、节点类型及监听器zookeeper集群写数据原理java操作zookeeper下载地址官网：https://zookeeper.apache.org/最新版本下载页面：https://zookeeper
Hadoop入门基础（二）：Hadoop集群安装与部署详解（超详细教程） william.zhang(张) hadoop 大数据分布式
一、环境准备1.集群规划首先，需要为集群中的每台机器设置角色和网络配置。在此示例中，我们使用三台机器：角色主机名IP地址NameNodemaster192.168.1.101DataNode1slave1192.168.1.102DataNode2slave2192.168.1.1032.软件要求操作系统：CentOS7或Ubuntu20.04JavaJDK：Hadoop需要JDK8或更高版本安装
zookeeper集群安装 shuair zookeeper zookeeper
zookeeper集群安装文档linux安装java-centos安装java-linux配置java环境变量zookeeper单机安装说明版本选择：apache-zookeeper-3.5.7-bin.tar.gz下载地址：https://archive.apache.org/dist/zookeeper/zookeeper-3.5.7/apache-zookeeper-3.5.7-bin.ta
使用 kind 集群安装运行极狐GitLab Runner【上】极小狐 kind gitlab 云原生 runner
GitLab是一个全球知名的一体化DevOps平台，很多人都通过私有化部署GitLab来进行源代码托管。极狐GitLab是GitLab在中国的发行版，专门为中国程序员服务。可以一键式部署极狐GitLab。关于kindkind是一个用来运行本地Kubernetes机群的工具，主要使用Docker容器来做为“nodes”。kind的主要设计目的是为了测试Kubernetes本身，但是也可以在本地研发或
centos7下elasticsearch6.5集群安装和基本使用 zwb_jianshu
elasticsearch官网地址为：https://www.elastic.co/本文档详细描述elasticsearch集群安装和基本使用。本例采用3台服务器，搭建四节点elasticsearch集群，其中一台服务器上运行两个elasticsearch程序。安装环境如下：CPU：六核心内存：8GB操作系统版本centos7.6elasticsearch-6.5.4、kibana-6.5.4、c
2.15日学习打卡----初学Zookeeper(二) 中北萌新程序员每日学习学习 zookeeper debian java 分布式
2.15日学习打卡目录:2.15日学习打卡一.Zookeeper部署运行伪集群安装集群安装服务管理二.Zookeeper系统模型数据模型节点特性客户端命令行节点数据信息Watcher监听机制权限控制ACL三.原生api操作Zookeeper四.zkclient库操作Zookeeper五.ApacheCurator操作Zookeeper六.Zookeeper高级四字命令选举机制一.Zookeeper
云服务器安装Kafka集群 NealLemon
上一篇云服务器搭建zookeeper集群讲解了在云服务器环境下，zookeeper集群的搭建，今天我们在其基础上来搭建一下在云服务器环境下kafka集群。服务器环境阿里云：轻量服务器1核2G(CENTOS)腾讯云：轻量服务器1核2G(CENTOS)金山云：轻量服务器1核2G(CENTOS)搭建Kafka集群安装Scala从scala官方网站地址下载，我这里下载的是scala-2.12.8.tgz。
hadoop 分布式集群安装与原理海牛大数据_青牛老师
对很多人来说，学习大数据都止步于集群搭建，即使是那些工作过很多年的JAVA程序员也不例外，我们分享一套能让您轻松完成集群搭建的方法，包括Hadoop的源码编译、企业级环境安装与配置和常用大数据组件的基本原理，请点击下面连接按笔记顺序进行学习服务器基础环境批量操作多台服务器zookeeper编译hadoop源码高可用（HA）HDFS安装HDFS原理以及常用命令yarn原理以及日常使用
搭建 Hadoop-3.1.3 HA 集群扛麻袋的少年 #Hadoop hadoop hdfs 大数据
本文目录1.集群部署分布规划2.Zookeepr集群安装3.HDFS-HAⅠ.配置core-site.xmlⅡ.配置hdfs-site.xmlⅢ.配置分发4.YARN-HAⅠ.配置yarn-site.xmlⅡ.配置分发4.启动前的配置5.启动HA集群Ⅰ.单独启动Ⅱ.脚本方式启动HA集群6.HA集群测试
ubuntu 22.04部署quincy版ceph 嗨安HiAn ceph linux ubuntu
ceph集群安装配置有多种方式，下方cephadm方式是借助容器部署。cephadm从ceph的octopus版本开始支持。安装需要主机配置安装了容器和python3。配置安排：ceph版本：quincy主机系统：ubuntu22.04docker版本：20.10ceph-monceph-mgrceph-osdceph100√√√，vdbceph101√√√，vdbceph102√×√，vdb安装
Kafka集群安装与部署在下区区俗物 kafka 分布式
集群规划准备工作安装安装包下载：链接：https://pan.baidu.com/s/1BtSiaf1ptLKdJiA36CyxJg?pwd=6666Kafka安装与配置1、上传并解压安装包tar-zxvfkafka_2.12-3.3.1.tgz-C/opt/moudle/2、修改解压后的文件名称mvkafka_2.12-3.3.1/kafka3、进入到/opt/module/kafka目录，修改
虚拟机VirtualBox和VMware安装Ubuntu16配置静态IP xk6891 tcp/ip 网络协议网络
计算机集群安装之前，准备先在虚拟机上尝试一下，网上多是采用VMware虚拟机和CentOS系统，个人则准备采用已经安装好的VirtualBox虚拟机和Ubuntu16，但遇到第一个问题即是配置静态IP，那么对于以上两种虚拟机静态IP配置的问题都记录一下：第一、对于三种虚拟网络常见连接方式需要了解一下可以参看VMware虚拟机三种网络模式：桥接模式，NAT模式，仅主机模式和VirtualBox网络配
k8s1.20 搭建-抛弃docker使用containerd 玄德公笔记 #02-k8s集群安装 k8s kubernetes 容器运维 k8s集群安装
前言：k8s动不动就要抛弃docker，好吧，让我们体验一下没有docker的k8s。其他相关文档：《k8s-1.21高可用集群搭建》文章目录前言：1.环境准备1.1关闭无用服务1.2环境和网络1.3依赖安装1.4系统优化2.安装Containerd2.1安装2.2修改配置文件2.3启动2.4测试3.k8s集群安装3.1安装服务3.2master初始化3.2.1初始化文件3.2.3下载镜像（非必要
【项目实战】Flink+InfluxDB+Grafana实现对YARN集群队列资源进行画像大数据研习社 Flink flink Flink实时计算可视化监控 InfluxDB
一、Flink实时计算第一章：Flink快速入门1.Flink架构2.Flink应用场景3.FlinkVSSpark4.实时计算技术选型第二章：Flink项目构建与测试1.快速构建Flink项目2.第一个Flink应用案例3.Flink单节点集群安装与测试4.FlinkShell代码测试第三章：FlinkONYARN集群部署1.FlinkONYARN集群架构讲解2.FlinkONYARN集群部署3
CentOS7集群安装JDK1.8 在下区区俗物 Hadoop集群安装部署 java linux 大数据
准备工作1、提前安装三台虚拟机，可以参考:https://mp.csdn.net/mp_blog/creation/editor/1360101082、三台虚拟机分别配置免密登录，参考：https://blog.csdn.net/LSW_JAVADP/article/details/121757927安装JDK一、官网下载对应JDK自己用的：链接：https://pan.baidu.com/s/1
CentOS7搭建Hadoop集群在下区区俗物 Hadoop集群安装部署 hadoop eclipse java
准备工作1、准备三台虚拟机，参考：CentOS7集群环境搭建（3台）-CSDN博客2、配置虚拟机之间免密登录，参考：CentOS7集群配置免密登录-CSDN博客3、虚拟机分别安装jdk，参考：CentOS7集群安装JDK1.8-CSDN博客4、下载Hadoop安装包，下载地址：链接：https://pan.baidu.com/s/1f1DmqNNFBvBDKi5beYl3Jg?pwd=6666搭建
大数据Zookeeper--案例泛黄的咖啡店大数据 zookeeper 分布式
文章目录服务器动态上下线监听案例需求需求分析具体实现测试Zookeeper分布式锁案例原生Zookeeper实现分布式锁Curator框架实现分布式锁Zookeeper面试重点选举机制生产集群安装多少zk合适zk常用命令服务器动态上下线监听案例需求某分布式系统中，主节点可以有多台，可以动态上下线，任意一台客户端都能实时感知到主节点服务器的上下线。需求分析具体实现1）先在集群上创建/servers节
Hadoop3.x单机安装教程文景大大
为什么要搭建单机环境的Hadoop？以最小化的成本学习和测试Hadoop；搭建基于Hadoop的上层应用，比如单机Spark环境需要先拥有单机的Hadoop；如果需要搭建分布式集群环境的Hadoop环境，请参考另外一篇：Hadoop3.x集群安装教程-(jianshu.com)一、准备工作首先从官网下载好Linux的JDK和Hadoop，Apache的软件可以从国内镜像下载，比较快。然后在阿里云上
Docker&k8s集群安装 no-muggle docker 云计算
1创建三台虚拟机使用VMware创建三台虚拟机，分别是k8s-master01、k8s-node01、k8s-node02。使用下面命令下载ifconfig工具。yuminstallnet-tools输入ifconfig命令查看ip地址并记录。使用下面命令改hostname的值：(改为k8s-master01)另外两台改为相应的名字。hostnamectlset-hostnamek8s-maste
Flink1.18.0集成Yarn-session模式部署 china-zhz flink yarn hadoop 大数据
上次部署了Hadoop集群Hadoop3.3.6（HDFS、YARN、MapReduce）完全分布式集群安装搭建这次集成下flinkYARN上部署的过程是：客户端把Flink应用提交给Yarn的ResourceManager,Yarn的ResourceManager会向Yarn的NodeManager申请容器。在这些容器上，Flink会部署JobManager和TaskManager的实例，从而启
Hadoop3.3.6（HDFS、YARN、MapReduce）完全分布式集群安装搭建 china-zhz hdfs mapreduce hadoop yarn
目录一、节点部署角色目录二、下载软件三、基础设施1、安装必要插件2、设置IP及主机名3、时间同步4、jdk安装5、ssh免密登录四、Hadoop部署1、目录及环境变量准备2、安装3、修改配置文件4、分发文件5、启动hadoop集群6、集群部署验证一、节点部署角色目录节点ipNNSNNDNRMNMHSnode1192.168.88.11√√node2192.168.88.12√√√√node3192
大数据Zookeeper--集群操作泛黄的咖啡店大数据 zookeeper 分布式
文章目录集群操作集群安装选举机制（面试重点）Zookeeper选举机制——第一次启动Zookeeper选举机制——非第一次启动ZK集群启动停止脚本客户端命令行操作命令行语法znode节点数据信息节点类型（持久/短暂/有序号/无序号）监听器原理节点删除和查看客户端API操作IDEA环境搭建创建Zookeeper客户端创建子节点获取子节点并监听节点变化判断Znode是否存在客户端向服务端写数据流程写流
06:原生云K8S解密｜K8S集群安装部署｜K8S网络插件桑_榆云计算 kubernetes 网络容器
原生云K8S解密｜K8S集群安装部署｜K8S网络插件K8SK8S集群架构图解K8S部署仓库初始化kube-master安装计算节点的安装token管理配置flannel网络（master主机操作）K8S有大量夸主机的容器需要管理，快速部署应用，快速扩展应用，无缝对接新的应用功能，节省资源，优化硬件资源的使用。K8S集群架构图解核心角色：master（管理节点）node（计算节点）image（镜像仓
Zookeeper集群安装万总有点菜
简介ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。ZooKeeper包含一个简单的原语
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

hadoop1.2.1+zk-3.4.4+hbase-0.94.12集群安装

你可能感兴趣的:(集群安装,zk-3.4.5,hbase-0.94.1,hadoop1.2.1)