super_man_0820

HDFS 系列七：HDFS HA 高可用

文章目录

7. HDFS HA 高可用

7.1 HA 概述
7.2 HDFS-HA 工作机制
7.3 HDFS-HA 手动故障转移

7.3.1 HDFS-HA 工作要点
7.3.2 环境准备
7.3.3 集群规划
7.3.4 配置 HDFS-HA 集群（以三台为例）
7.3.5 启动 HDFS-HA 集群
7.3.6 HDFS-HA 集群手动故障转移

7.4 HDFS-HA 自动故障转移

7.4.1 工作要点
7.4.2 ZooKeeper 在自动故障转移中的作用

7.4.2.1 故障检测
7.4.2.2 现役 NameNode 选择

7.4.3 环境准备
7.4.4 规划集群
7.4.5 配置 Zookeeper 集群

7.4.5.1 Zookeeper 集群规划
7.4.5.2 解压安装
7.4.5.3 配置 zoo.cfg 文件

7.4.6 配置 HDFS-HA 集群（以三台为例）
7.4.7 启动

7.4.8 验证

7.4.9 HDFS-HA 自动故障转移失败的原因

7.5 YARN-HA 配置

7.5.1 YARN-HA 工作机制
7.5.2 配置 YARN-HA 集群

7.5.2.1 环境准备
7.5.2.2 规划集群

7.5.2.3 配置 yarn-site.xml
7.4.2.4 启动 Hdfs

7.5 HDFS Federation 架构设计

7.5.1 NameNode 架构的局限性
7.5.2 HDFS Federation 架构设计
7.5.3 HDFS Federation 应用思考

7. HDFS HA 高可用

7.1 HA 概述

所谓 HA（high available），即高可用（7*24小时不中断服务）

实现高可用最关键的策略是消除单点故障，HA 严格来说应该分成各个组件的 HA 机制：HDFS的HA 和 YARN的HA

Hadoop2.0 之前，在 HDFS 集群中 NameNode 存在单点故障（SPOF）

NameNode 主要在以下两个方面影响 HDFS 集群

1. NameNode 机器发生意外，如宕机，集群将无法使用，直到管理员重启
2. NameNode 机器需要升级，包括软件、硬件升级，此时集群也将无法使用

HDFS HA 功能通过配置 Active/Standby 两个 NameNodes 实现在集群中对 NameNode 的热备来解决上述问题

如果出现故障，如机器崩溃或机器需要升级维护，这时可通过此种方式将 NameNode 很快的切换到另外一台机器

注意：HDFS 配置 HA 后，SecondNamenode 的角色被备用 Namenode 所包含，备用 Namenode 为活动的 Namenode 命名空间设置周期性的检查点

7.2 HDFS-HA 工作机制

通过双 NameNode 消除单点故障

7.3 HDFS-HA 手动故障转移

7.3.1 HDFS-HA 工作要点

元数据管理方式需要改变：

内存中各自保存一份元数据

Edits 日志只有 Active 状态的 Namenode 节点可以做写操作

两个 Namenode 都可以读取 edits

共享的 edits 放在一个共享存储中管理（qjournal 和 NFS 两个主流实现）
需要一个状态管理功能模块

实现了一个 zkfailover，常驻在每一个 Namenode 所在的节点，每一个 zkfailover 负责监控自己所在 Namenode 节点，利用 zk 进行状态标识，当需要进行状态切换时，由 zkfailover 来负责切换，切换时需要防止 brain split 现象的发生
必须保证两个 NameNode 之间能够 ssh 无密码登录
隔离（Fence），即同一时刻仅仅有一个 NameNode 对外提供服务

7.3.2 环境准备

将上面 master、slave1、slave2 三个机器克隆修改相关配置即可，要点如下：

修改 IP （可以保持不变）、主机名（改为 hadoop-1，hadoop-2，hadooop-3）
```
hadoop-1 192.168.27.101
hadoop-2 192.168.27.102
hadoop-3 192.168.27.103
```
修改主机名及主机名和 IP 地址的映射
关闭防火墙
ssh 免密登录
清空 Hadoop 的 data 和 logs

7.3.3 集群规划

hadoop-1	hadoop-2	hadooop-3
NameNode	NameNode	-
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
-	ResourceManager	-
NodeManager	NodeManager	NodeManager

7.3.4 配置 HDFS-HA 集群（以三台为例）

官方地址：https://hadoop.apache.org/docs/r2.9.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

配置 core-site.xml


    
    
        fs.defaultFS
        hdfs://mycluster
    

    
    
        dfs.journalnode.edits.dir
        /usr/local/hadoop/tmp/dfs/data/jn
    

    
    
        hadoop.tmp.dir
        /usr/hadoop/tmp

配置 hdfs-site.xml



    
    
        dfs.nameservices
        mycluster
    

    
    
        dfs.ha.namenodes.mycluster
        nn1,nn2
    

    
    
        dfs.namenode.rpc-address.mycluster.nn1
        hadoop-1:8020
    

    
    
        dfs.namenode.rpc-address.mycluster.nn2
        hadoop-2:8020
    

    
    
        dfs.namenode.http-address.mycluster.nn1
        hadoop-1:50070
    

    
    
        dfs.namenode.http-address.mycluster.nn2
        hadoop-2:50070
    

    
    
        dfs.namenode.shared.edits.dir
        qjournal://hadoop-1:8485;hadoop-2:8485;hadoop-3:8485/mycluster
    

    
    
        dfs.ha.fencing.methods
        sshfence
    

    
    
        dfs.ha.fencing.ssh.private-key-files
        /root/.ssh/id_rsa
    

    
    
        dfs.permissions.enable
        false
    

    
    
        dfs.client.failover.proxy.provider.mycluster
        org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider

拷贝配置好的 hadoop 环境到其他节点

7.3.5 启动 HDFS-HA 集群

在各个 JournalNode 节点上，输入以下命令启动 JournalNode 服务

[root@hadoop-1 hadoop]# hadoop-daemon.sh start journalnode
starting journalnode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-journalnode-hadoop-1.out
[root@hadoop-1 hadoop]# jps
2709 Jps
2648 JournalNode

[root@hadoop-2 hadoop]# hadoop-daemon.sh start journalnode
starting journalnode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-journalnode-hadoop-2.out
[root@hadoop-2 hadoop]# jps
2578 JournalNode
2639 Jps

[root@hadoop-3 hadoop]# hadoop-daemon.sh start journalnode
starting journalnode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-journalnode-hadoop-3.out
[root@hadoop-3 hadoop]# jps
2946 JournalNode
3007 Jps

在 [nn1] 上，对其进行格式化，并启动

[root@hadoop-1 hadoop]# hdfs namenode -format

[root@hadoop-1 hadoop]# hadoop-daemon.sh start namenode
starting namenode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-namenode-hadoop-1.out

目前 hadoop-1 已启动，为 standby 状态，如下图

在 [nn2] 上，同步 nn1 的元数据信息
```
[root@hadoop-2 hadoop]# hdfs namenode -bootstrapStandby
```
可以从日志看出从 [nn1] 进行同步，如下图：
启动 [nn2]
```
[root@hadoop-2 hadoop]# hadoop-daemon.sh start namenode
```
目前 hadoop-2 已启动，也为 standby 状态，如下图
在 [nn1] 上，启动所有 Datanode
```
[root@hadoop-1 .ssh]# hadoop-daemons.sh start datanode
```
备注：hadoop-daemons 本质是到 slaves 文件中找所有 DataNode

此时所有 Namenode 都是 standby 状态，不支持读文件

将 [nn1] 切换为 Active

[root@hadoop-1 .ssh]# hdfs haadmin -transitionToActive nn1

查看是否 Active

[root@hadoop-1 .ssh]# hdfs haadmin -getServiceState nn1
active

7.3.6 HDFS-HA 集群手动故障转移

强杀 Active NameNode [nn1]

[root@hadoop-1 hadoop]# jps
4389 Jps
2648 JournalNode
3112 NameNode
4091 DataNode
[root@hadoop-1 hadoop]# kill -9 3112

手动将 [nn2] 切为 Active

[root@hadoop-1 hadoop]# hdfs haadmin -transitionToActive nn2

20/03/07 16:49:45 INFO ipc.Client: Retrying connect to server: hadoop-1/192.168.27.101:8020. Already tried 0 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=1, sleepTime=1000 MILLISECONDS)
Unexpected error occurred  Call From hadoop-1/192.168.27.101 to hadoop-1:8020 failed on connection exception: java.net.ConnectException: Connection refused; For more details see:  http://wiki.apache.org/hadoop/ConnectionRefused
Usage: haadmin [-ns ] [-transitionToActive [--forceactive] ]

发现 Connection refused，因为为了防止脑裂，[nn2] 必须和 [nn1] 取得联系，但是此时 [nn1] 已挂，所以必须先把 [nn1] 先启动，再手动将 [nn2] 切为 Active

启动 [nn1]

[root@hadoop-1 hadoop]# hadoop-daemon.sh start namenode
starting namenode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-namenode-hadoop-1.out

此时 [nn1] 和 [nn2] 都是 standyby 状态

手动将 [nn2] 切为 Active

[root@hadoop-1 hadoop]# hdfs haadmin -transitionToActive nn2

7.4 HDFS-HA 自动故障转移

7.4.1 工作要点

前面使用命令 hdfs haadmin -failover 手动进行故障转移，在该模式下，即使现役 NameNode 已经失效，系统也不会自动从现役 NameNode 转移到待机 NameNode，下面配置部署 HA 自动进行故障转移

自动故障转移为 HDFS 部署增加了两个新组件：ZooKeeper 和 ZKFailoverController（ZKFC） 进程

ZooKeeper 是维护少量协调数据，通知客户端这些数据的改变和监视客户端故障的高可用服务

7.4.2 ZooKeeper 在自动故障转移中的作用

7.4.2.1 故障检测

集群中的每个 NameNode 在 ZooKeeper 中维护了一个持久会话，如果机器崩溃，ZooKeeper 中的会话将终止，ZooKeeper 通知另一个 NameNode 需要触发故障转移

7.4.2.2 现役 NameNode 选择

ZooKeeper 提供了一个简单的机制用于唯一的选择一个节点为 active 状态

如果目前现役 NameNode 崩溃，另一个节点可能从 ZooKeeper 获得特殊的排外锁以表明它应该成为现役 NameNode

ZKFC 是自动故障转移中的另一个新组件，是 ZooKeeper 的客户端，也监视和管理 NameNode 的状态

每个运行 NameNode 的主机也运行了一个 ZKFC 进程，ZKFC 负责：

健康监测

ZKFC 使用一个健康检查命令定期地 ping 与之在相同主机的 NameNode，只要该 NameNode 及时地回复健康状态，ZKFC 认为该节点是健康的

如果该节点崩溃，冻结或进入不健康状态，健康监测器标识该节点为非健康的
ZooKeeper 会话管理

当本地 NameNode 是健康的，ZKFC 保持一个在 ZooKeeper 中打开的会话

如果本地 NameNode 处于 active 状态，ZKFC 也保持一个特殊的 znode 锁，该锁使用了 ZooKeeper 对短暂节点的支持，如果会话终止，锁节点将自动删除
基于 ZooKeeper 的选择

如果本地 NameNode 是健康的，且 ZKFC 发现没有其它的节点当前持有 znode 锁，它将为自己获取该锁

如果成功，则它已经赢得了选择，并负责运行故障转移进程以使它的本地 NameNode 为 active

故障转移进程与前面描述的手动故障转移相似，首先如果必要保护之前的现役 NameNode，然后本地 NameNode 转换为 active 状态

7.4.3 环境准备

将上面 master、slave1、slave2 三个机器克隆修改相关配置即可，要点如下：

修改 IP （可以保持不变）、主机名（改为 hadoop-1，hadoop-2，hadooop-3）
```
hadoop-1 192.168.27.101
hadoop-2 192.168.27.102
hadoop-3 192.168.27.103
```
修改主机名及主机名和 IP 地址的映射
关闭防火墙
ssh 免密登录
清空 Hadoop 的 data 和 logs

7.4.4 规划集群

hadoop-1	hadoop-2	hadoop-3
NameNode	NameNode	-
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
ZK	ZK	ZK
-	ResourceManager	-
NodeManager	NodeManager	NodeManager

7.4.5 配置 Zookeeper 集群

7.4.5.1 Zookeeper 集群规划

在 hadoop-1、hadoop-2 和 hadoop-3 三个节点上部署 Zookeeper

7.4.5.2 解压安装

解压 Zookeeper 安装包到 /usr/zookeeper/ 目录下

[root@hadoop-1 zookeeper]# tar -zxvf zookeeper-3.4.14.tar.gz -C /usr/zookeeper/

在 /usr/zookeeper/zookeeper-3.4.14 这个目录下创建 zkData
```
[root@hadoop-1 zookeeper-3.4.14]# mkdir -p zkData
```
复制 /usr/zookeeper/zookeeper-3.4.14/conf 这个目录下的 zoo_sample.cfg 为 zoo.cfg
```
[root@hadoop-1 conf]# cp zoo_sample.cfg zoo.cfg
```

7.4.5.3 配置 zoo.cfg 文件

具体配置

dataDir=/usr/zookeeper/zookeeper-3.4.14/zkData

增加如下配置

#######################cluster##########################
server.1=hadoop-1:2888:3888
server.2=hadoop-2:2888:3888
server.3=hadoop-3:2888:3888

配置参数解读

Server.A=B:C:D

A 是一个数字，表示这个是第几号服务器

B 是这个服务器的 ip 地址

C 是这个服务器与集群中的 Leader 服务器交换信息的端口

D 是万一集群中的Leader服务器挂了，需要一个端口来重新进行选举，选出一个新的 Leader，而这个端口就是用来执行选举时服务器相互通信的端口

集群模式下配置一个文件 myid，这个文件在 dataDir 目录下，这个文件里面有一个数据就是 A 的值，Zookeeper 启动时读取此文件，拿到里面的数据与 zoo.cfg 里面的配置信息比较从而判断到底是哪个 server

集群操作

A. 在 /usr/zookeeper/zookeeper-3.4.14/zkData 目录下创建一个 myid 的文件

touch myid

添加 myid 文件，注意一定要在 linux 里面创建，在 notepad++ 里面很可能乱码

B. 编辑 myid 文件

vim myid

在文件中添加与 server 对应的编号：如 1

C. 拷贝配置好的 zookeeper 到其他机器上

scp -r /usr/zookeeper/zookeeper-3.4.14/ root@hadoop-2:/usr/zookeeper/zookeeper-3.4.14/
scp -r /usr/zookeeper/zookeeper-3.4.14/ root@hadoop-3:/usr/zookeeper/zookeeper-3.4.14/

并分别修改myid文件中内容为 2、3

D. 分别启动 zookeeper

[root@hadoop-1 zookeeper-3.4.14]# bin/zkServer.sh start
[root@hadoop-2 zookeeper-3.4.14]# bin/zkServer.sh start
[root@hadoop-3 zookeeper-3.4.14]# bin/zkServer.sh start

E. 查看状态

[root@hadoop-1 zookeeper-3.4.14]# bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/zookeeper/zookeeper-3.4.14/bin/../conf/zoo.cfg
Mode: follower

[root@hadoop-2 zookeeper-3.4.14]# bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/zookeeper/zookeeper-3.4.14/bin/../conf/zoo.cfg
Mode: follower

[root@hadoop-3 zookeeper-3.4.14]# bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/zookeeper/zookeeper-3.4.14/bin/../conf/zoo.cfg
Mode: leader

hadoop-1、hadoop-2 为 follower，hadoop-3 为 leader

7.4.6 配置 HDFS-HA 集群（以三台为例）

官方地址：https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html
配置 core-site.xml

在前面手动 HA 配置的基础上，新增 [core-site.xml] 配置
```
	ha.zookeeper.quorum
	hadoop-1:2181,hadoop-2:2181,hadoop-3:2181
```
配置 hdfs-site.xml

在前面手动 HA 配置的基础上，新增 [hdfs-site.xml] 配置
```
	dfs.ha.automatic-failover.enabled
	true
```
拷贝配置好的 hadoop 环境到其他节点

7.4.7 启动

关闭所有 HDFS 服务

[root@hadoop-1 hadoop-2.9.2]# stop-dfs.sh

启动 Zookeeper 集群

[root@hadoop-1 zookeeper-3.4.14]# bin/zkServer.sh start
[root@hadoop-2 zookeeper-3.4.14]# bin/zkServer.sh start
[root@hadoop-3 zookeeper-3.4.14]# bin/zkServer.sh start

检查 ZK 启动状态，一个 leader，两个 follower

初始化 HA 在 Zookeeper 中状态

[root@hadoop-1 hadoop-2.9.2]# hdfs zkfc -formatZK

初始化 ZK 的 HA 状态后，可到 ZK 上确认 hadoop-ha 目录存在，并且 mycluster 集群已被 ZK 管理

[root@hadoop-2 hadoop-2.9.2]# cd /usr/zookeeper/zookeeper-3.4.14/
[root@hadoop-2 zookeeper-3.4.14]# bin/zkCli.sh
......
[zk: localhost:2181(CONNECTED) 0] ls /
[zookeeper, hadoop-ha]
[zk: localhost:2181(CONNECTED) 1] ls /hadoop-ha
[mycluster]

启动 HDFS 服务：

[root@hadoop-1 hadoop-2.9.2]# start-dfs.sh
Starting namenodes on [hadoop-1 hadoop-2]
hadoop-1: starting namenode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-namenode-hadoop-1.out
hadoop-2: starting namenode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-namenode-hadoop-2.out
hadoop-1: starting datanode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-datanode-hadoop-1.out
hadoop-3: starting datanode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-datanode-hadoop-3.out
hadoop-2: starting datanode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-datanode-hadoop-2.out
Starting journal nodes [hadoop-1 hadoop-2 hadoop-3]
hadoop-1: starting journalnode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-journalnode-hadoop-1.out
hadoop-2: starting journalnode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-journalnode-hadoop-2.out
hadoop-3: starting journalnode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-journalnode-hadoop-3.out
Starting ZK Failover Controllers on NN hosts [hadoop-1 hadoop-2]
hadoop-1: starting zkfc, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-zkfc-hadoop-1.out
hadoop-2: starting zkfc, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-zkfc-hadoop-2.out

启动 HDFS 服务，观察启动日志，发现主要启动了：

(1) namenodes ： [hadoop-1 hadoop-2]

(2) journal nodes : [hadoop-1 hadoop-2 hadoop-3]

(3) ZK Failover Controllers : [hadoop-1 hadoop-2] (ZKFC 跟着 NN 走)

在各个节点上 jps 观察所有组件启动成功，在 web 界面观察两个 Namenode 的状态

NameNode 先启动的就是 Active 状态

7.4.8 验证

将 Active NameNode 进程 kill
```
[root@hadoop-1 hadoop-2.9.2]# jps
5028 DataNode
2581 QuorumPeerMain
5607 Jps
5256 JournalNode
5465 DFSZKFailoverController
4910 NameNode
[root@hadoop-1 hadoop-2.9.2]# kill -9 4910
```
但是遗憾发现，Namenode1 被 kill 之后，Namenode2 并没有启动，解决方式见： 7.4.9 HDFS-HA 自动故障转移失败的原因

，到 Namenode2 节点上看 hadoop-root-zkfc-hadoop-2.log 日志
将 Active NameNode 机器断开网络
```
service network stop
```

观察上述两个场景下的 HDFS-HA 自动故障转移

7.4.9 HDFS-HA 自动故障转移失败的原因

如果发现 HA 配置没有问题，但是不能自动切换 active 的 Namenode，我们可以查看 zkfc 的 log 日志，看是否会出现下面的 Warn 或者 Exception：

hadoop-2 ssh 到 hadoop-1 上，尝试连接到 8020 这个 rpc 端口，但是因为 hadoop-1 上的 Namenode 进程被关了，自然连不上

hadoop-2 使用了 fuser 工具，但是装的 Centos 是最小化安装，并不包含 fuser，所以需要在所有 Namenode 机器（hadoop-1，hadoop-2）上安装 fuser

[root@hadoop-1 logs]# yum install psmisc
[root@hadoop-2 logs]# yum install psmisc

7.5 YARN-HA 配置

7.5.1 YARN-HA 工作机制

官方文档

https://hadoop.apache.org/docs/stable/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html

YARN-HA 工作机制

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0GuSX3dm-1583649732230)(https://hadoop.apache.org/docs/stable/hadoop-yarn/hadoop-yarn-site/images/rm-ha-overview.png)]

7.5.2 配置 YARN-HA 集群

7.5.2.1 环境准备

在前面 Hdfs HA 的基础上进行配置

7.5.2.2 规划集群

和前面 Hdfs HA 的集群的基础上规划：hadoop-1 和 hadoop-2 上配置 active/standby ResourceManager

hadoop-1	hadoop-2	hadoop-3
NameNode	NameNode	-
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
ZK	ZK	ZK
ResourceManager	ResourceManager	-
NodeManager	NodeManager	NodeManager

7.5.2.3 配置 yarn-site.xml

[yarn-site.xml]



	

	
	
		yarn.nodemanager.aux-services
		mapreduce_shuffle
	

    
    
        yarn.resourcemanager.ha.enabled
        true
    
 
    
    
        yarn.resourcemanager.cluster-id
        cluster-yarn
    

    
        yarn.resourcemanager.ha.rm-ids
        rm1,rm2
    

    
        yarn.resourcemanager.hostname.rm1
        hadoop-1
    

    
        yarn.resourcemanager.hostname.rm2
        hadoop-2
    
 
     
    
        yarn.resourcemanager.zk-address
        hadoop-1:2181,hadoop-2:2181,hadoop-3:2181
    

     
    
        yarn.resourcemanager.recovery.enabled
        true
    
 
     
    
        yarn.resourcemanager.store.class     
		org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore
    
	
	
	
		yarn.nodemanager.vmen-check-enabled
		false

同步更新其他节点的配置信息

7.4.2.4 启动 Hdfs

前置状态：ZK 集群已起，Hadoop 未起

启动 Hdfs

[root@hadoop-1 hadoop]# start-dfs.sh 
Starting namenodes on [hadoop-1 hadoop-2]
hadoop-1: starting namenode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-namenode-hadoop-1.out
hadoop-2: starting namenode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-namenode-hadoop-2.out
hadoop-1: starting datanode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-datanode-hadoop-1.out
hadoop-3: starting datanode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-datanode-hadoop-3.out
hadoop-2: starting datanode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-datanode-hadoop-2.out
Starting journal nodes [hadoop-1 hadoop-2 hadoop-3]
hadoop-1: starting journalnode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-journalnode-hadoop-1.out
hadoop-3: starting journalnode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-journalnode-hadoop-3.out
hadoop-2: starting journalnode, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-journalnode-hadoop-2.out
Starting ZK Failover Controllers on NN hosts [hadoop-1 hadoop-2]
hadoop-1: starting zkfc, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-zkfc-hadoop-1.out
hadoop-2: starting zkfc, logging to /usr/hadoop/hadoop-2.9.2/logs/hadoop-root-zkfc-hadoop-2.out

注意，此处 namenodes 在 [hadoop-1 hadoop-2] 都起来了！

启动 Yarn

因为配置了 ResourceManager 在 hadoop-1、hadoop-2 上，所以在 hadoop-2 上启动效果一样

[root@hadoop-2 hadoop]# yarn-daemon.sh start resourcemanager
starting resourcemanager, logging to /usr/hadoop/hadoop-2.9.2/logs/yarn-root-resourcemanager-hadoop-2.out

[root@hadoop-2 hadoop]# jps
24064 DataNode
24432 ResourceManager
24688 Jps
4995 QuorumPeerMain
23978 NameNode
24314 DFSZKFailoverController
24174 JournalNode

确认 ResourceManager 在 hadoop-2 上启动成功，可再次在 web 端确认:

但是和 Hdfs HA 不一样，此时 hadoop-1 上并不会启动 ResourceManager，需要我们再次启动

[root@hadoop-1 hadoop]# yarn-daemon.sh start resourcemanager
starting resourcemanager, logging to /usr/hadoop/hadoop-2.9.2/logs/yarn-root-resourcemanager-hadoop-1.out

查看服务状态

[root@hadoop-3 hadoop]# yarn rmadmin -getServiceState rm1
standby

[root@hadoop-3 logs]# yarn rmadmin -getServiceState rm2
active

可见 rm2 是 active 状态

7.5 HDFS Federation 架构设计

7.5.1 NameNode 架构的局限性

Namespace（命名空间）的限制

由于 NameNode 在内存中存储所有的元数据（metadata），因此单个 Namenode 所能存储的对象（文件+块）数目受到 Namenode 所在 JVM 的 heap size 的限制

50G 的 heap 能够存储 20亿（200million）个对象，这 20 亿个对象支持 4000 个 Datanode，12PB 的存储（假设文件平均大小为 40MB）

随着数据的飞速增长，存储的需求也随之增长

单个 Datanode 从 4T 增长到 36T，集群的尺寸增长到 8000 个 Datanode，存储的需求从 12PB 增长到大于100PB
隔离问题

由于 HDFS 仅有一个 Namenode，无法隔离各个程序，因此 HDFS 上的一个实验程序就很有可能影响整个 HDFS 上运行的程序
性能的瓶颈

由于是单个 Namenode 的 HDFS 架构，因此整个 HDFS 文件系统的吞吐量受限于单个 Namenode 的吞吐量

7.5.2 HDFS Federation 架构设计

能不能有多个NameNode

NameNode	NameNode	NameNode
元数据	元数据	元数据
Log	machine	电商数据/话单数据

7.5.3 HDFS Federation 应用思考

不同应用可以使用不同 NameNode 进行数据管理

图片业务、爬虫业务、日志审计业务

Hadoop 生态系统中，不同的框架使用不同的 NameNode 进行管理 Namespace（隔离性）

你可能感兴趣的:(hadoop)

浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
Spark集群的三种模式 MelodyYN #Spark spark hadoop big data
文章目录1、Spark的由来1.1Hadoop的发展1.2MapReduce与Spark对比2、Spark内置模块3、Spark运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式3.2Yarn模式安装部署配置历史服务器运行模式4、WordCount案例1、Spark的由来定义：Hadoop主要解决，海量数据的存储和海量数据的分析计算。Spark是一种基于内存的快速、通用、可
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
HBase介绍 mingyu1016 数据库
概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
Java中的大数据处理框架对比分析省赚客app开发者 java 开发语言
Java中的大数据处理框架对比分析大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将深入探讨Java中常用的大数据处理框架，并对它们进行对比分析。大数据处理框架是现代数据驱动应用的核心，它们帮助企业处理和分析海量数据，以提取有价值的信息。本文将重点介绍ApacheHadoop、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的
Hadoop windows intelij 跑 MR WordCount piziyang12138
一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9Hadoop分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven工程。(如果只跑MapReduce创建java工程即可，不用勾选Creatfromarchetype，如果想创建web工程或者使用骨架可以勾选)image.png设置GroupId和Artif
Hadoop学习第三课（HDFS架构--读、写流程）小小程序员呀~ 数据库 hadoop 架构 big data
1.块概念举例1：一桶水1000ml，瓶子的规格100ml=>需要10个瓶子装完一桶水1010ml，瓶子的规格100ml=>需要11个瓶子装完一桶水1010ml，瓶子的规格200ml=>需要6个瓶子装完块的大小规格，只要是需要存储，哪怕一点点，也是要占用一个块的块大小的参数：dfs.blocksize官方默认的大小为128M官网：https://hadoop.apache.org/docs/r3.
hadoop启动HDFS命令 m0_67401228 java 搜索引擎 linux 后端
启动命令：/hadoop/sbin/start-dfs.sh停止命令：/hadoop/sbin/stop-dfs.sh
【计算机毕设-大数据方向】基于Hadoop的电商交易数据分析可视化系统的设计与实现程序员-石头山大数据实战案例大数据 hadoop 毕业设计毕设
博主介绍：✌全平台粉丝5W+,高级大厂开发程序员，博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来，同学门有不懂的毕设选题，项目以及论文编写等相关问题都可以和学长沟通，希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展，电商平台积累了海量的数据资源，这些数据不仅包括用户的基本信息、购物记录，还包括用户的浏览行为、评价反馈等多
分布式离线计算—Spark—基础介绍测试开发abbey 人工智能—大数据
原文作者：饥渴的小苹果原文地址：【Spark】Spark基础教程目录Spark特点Spark相对于Hadoop的优势Spark生态系统Spark基本概念Spark结构设计Spark各种概念之间的关系Executor的优点Spark运行基本流程Spark运行架构的特点Spark的部署模式Spark三种部署方式Hadoop和Spark的统一部署摘要：Spark是基于内存计算的大数据并行计算框架Spar
spark常用命令我是浣熊的微笑 spark
查看报错日志：yarnlogsapplicationIDspark2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$SPARK_HOME目录，输入bin/spark-submit--help可以得到该命令的使用帮助。hadoop@wyy:/app/hadoop/spark100$bin/spark-submit--
spark启动命令学不会又听不懂 spark 大数据分布式
hadoop启动：cd/root/toolssstart-dfs.sh，只需在hadoop01上启动stop-dfs.sh日志查看：cat/root/toolss/hadoop/logs/hadoop-root-datanode-hadoop03.outzookeeper启动：cd/root/toolss/zookeeperbin/zkServer.shstart，三台都要启动bin/zkServ
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
Hadoop常见面试题整理及解答叶青舟 Linux hdfs 大数据 hadoop linux
Hadoop常见面试题整理及解答一、基础知识篇：1.把数据仓库从传统关系型数据库转到hadoop有什么优势？答：（1）关系型数据库成本高，且存储空间有限。而Hadoop使用较为廉价的机器存储数据，且Hadoop可以将大量机器构建成一个集群，并在集群中使用HDFS文件系统统一管理数据，极大的提高了数据的存储及处理能力。（2）关系型数据库仅支持标准结构化数据格式，Hadoop不仅支持标准结构化数据格式
2025毕业设计指南：如何用Hadoop构建超市进货推荐系统？大数据分析助力精准采购计算机编程指导师 Java实战集 Python实战集大数据实战集课程设计 hadoop 数据分析 spring boot java 进货 python
✍✍计算机编程指导师⭐⭐个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程序/安卓实战项目大数据实战项目⚡⚡文末获取源码文章目录⚡⚡文末获取源码基于hadoop的超市进货推荐系
Hadoop Common 之序列化机制小解猫君之上 #Apache Hadoop
1.JavaSerializable序列化该序列化通过ObjectInputStream的readObject实现序列化，ObjectOutputStream的writeObject实现反序列化。这不过此种序列化虽然跨病态兼容性强，但是因为存储过多的信息，但是传输效率比较低，所以hadoop弃用它。（序列化信息包括这个对象的类，类签名，类的所有静态，费静态成员的值，以及他们父类都要被写入）publ
深入理解hadoop(一)----Common的实现----Configuration maoxiao_jsd 深入理解----hadoop
属本人个人原创，转载请注明,希望对大家有帮助！！一,hadoop的配置管理a,hadoop通过独有的Configuration处理配置信息Configurationconf=newConfiguration();conf.addResource("core-default.xml");conf.addResource("core-site.xml");后者会覆盖前者中未final标记的相同配置项b
hadoop 0.22.0 部署笔记 weixin_33701564 大数据 java 运维
为什么80%的码农都做不了架构师？>>>因为需要使用hbase，所以开始对hbase进行学习。hbase是部署在hadoop平台上的NOSql数据库，因此在部署hbase之前需要先部署hadoop。环境：redhat5、hadoop-0.22.0.tar.gz、jdk-6u13-linux-i586.zipip192.168.1.128hostname：localhost.localdomain（
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(4) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！org.apache.hadoophadoop-com
解决Windows环境下hadoop集群的运行_window运行hadoop,unknown hadoop01(3) 2401_84160087 大数据面试学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！xmlns:xsi="http://www.w3.or
深入解析HDFS：定义、架构、原理、应用场景及常用命令 CloudJourney hdfs 架构 hadoop
引言Hadoop分布式文件系统（HDFS，HadoopDistributedFileSystem）是Hadoop框架的核心组件之一，它提供了高可靠性、高可用性和高吞吐量的大规模数据存储和管理能力。本文将从HDFS的定义、架构、工作原理、应用场景以及常用命令等多个方面进行详细探讨，帮助读者全面深入地了解HDFS。1.HDFS的定义1.1什么是HDFSHDFS是Hadoop生态系统中的一个分布式文件系
Hadoop的搭建流程 lzhlizihang hadoop 大数据分布式
文章目录一、配置IP二、配置主机名三、配置主机映射四、关闭防火墙五、配置免密六、安装jdk1、第一步：2、第二步：3、第三步：4、第四步：5、第五步：七、安装hadoop1、上传2、解压3、重命名4、开始配置环境变量5、刷新配置文件6、验证hadoop命令是否可以识别八、全分布搭建7、修改配置文件core-site.xml8、修改配置文件hdfs-site.xml9、修改配置文件hadoop-en
hive搭建 -----内嵌模式和本地模式 lzhlizihang hive hadoop
文章目录一、内嵌模式（使用较少）1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动hadoop集群6、给hdfs创建文件夹7、修改hive-site.xml中的非法字符8、初始化元数据9、测试是否成功10、内嵌模式的缺点二、本地模式（最常用）1、检查mysql是否正常2、上传、解压、重命名3、配置环境变量4、修改c
Hadoop之mapreduce -- WrodCount案例以及各种概念 lzhlizihang hadoop mapreduce 大数据
文章目录一、MapReduce的优缺点二、MapReduce案例--WordCount1、导包2、Mapper方法3、Partitioner方法（自定义分区器）4、reducer方法5、driver（main方法）6、Writable（手机流量统计案例的实体类）三、关于片和块1、什么是片，什么是块？2、mapreduce启动多少个MapTask任务？四、MapReduce的原理五、Shuffle过
IAAS: IT公司去IOE-Alibaba系统构架解读 wishchin 心理学/职业 BigDataMini Spark PaaS
从Hadoop到自主研发，技术解读阿里去IOE后的系统架构原地址：......................云计算阿里飞天摘要：从IOE时代，到Hadoop与飞天并行，再到飞天单集群5000节点的实现，阿里一直摸索在技术衍变的前沿。这里，我们将从架构、性能、运维等多个方面深入了解阿里基础设施。【导读】互联网的普及，智能终端的增加，大数据时代悄然而至。在这个数据为王的时代，数十倍、数百倍的数据给各
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR