云主宰苍穹

Hadoop的高可用HA部署

引言

有基础的读者，可以直接跳到第三章：环境搭建。前面两章都是一些相关的理论基础和准备工作。而对于完全是第一次搭建Hadoop高可用HA集群的读者，强烈建议花几分钟看一看这些理论基础和准备工作，便于后面更好地理解和搭建集群环境。

理论分析

本章将从进程间的通信机制RPC，Hadoop基础理论和ZooKeeper基础理论来阐述，首先对此有一定的理论理解基础，便于后面的环境快速搭建。
关于RPC、Hadoop和ZooKeeper的基础理论和角色说明，都只是简单的阐述一些基础理论和几个常见的角色，而不是只有这些角色，想要更加深入了解每一个模块的机制，了解每一个模块的工作机制和其对应的角色功能，可以查看Apache关于Hadoop的官方文档说明。

RPC通信机制

Hadoop内部的所有通信机制都是采用RPC通信，每一个进程都有对应的RPC通信端口，与TCP和UDP的通信端口不同。注意区分RPC内部通信端口和HTTP通信端口。
RPC（Remote Procedure Call）—远程过程调用，它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发包括网络分布式多程序在内的应用程序更加容易。
RPC采用客户机/服务器模式。请求程序就是一个客户机，而服务提供程序就是一个服务器。首先，客户机调用进程发送一个有进程参数的调用信息到服务进程，然后等待应答信息。在服务器端，进程保持睡眠状态直到调用信息到达为止。当一个调用信息到达，服务器获得进程参数，计算结果，发送答复信息，然后等待下一个调用信息，最后，客户端调用进程接收答复信息，获得进程结果，然后调用执行继续进行。
有多种 RPC模式和执行。最初由 Sun 公司提出。IETF ONC 宪章重新修订了 Sun 版本，使得 ONC RPC 协议成为 IETF 标准协议。现在使用最普遍的模式和执行是开放式软件基础的分布式计算环境（DCE）。

Hadoop基础理论

Hadoop就是一个分布式计算的解决方案，也就是帮助我们把一个任务分到很多台计算机来计算。Hadoop是Apache基金会开源的一个框架，可编写和运行分布式应用处理大规模数据，是专为离线和大规模数据分析而设计的，并不适合那种对几个记录随机读写的在线事务处理模式。
Apache关于Hadoop简介点击这里
Hadoop1.x版本：分布式文件系统(HDFS)和分布式计算框架(MapReduce)
Hadoop2.x版本：分布式文件系统(HDFS)、分布式计算框架(MapReduce)和分布式资源调度(YARN)
Hadoop3.x版本：HDFS+MapReduce+YARN，在2.x版本上进行一系列的更改。详细的更改文档请点击这里
分布式文件系统HDFS是主从架构模型系统，一个HDFS集群和GFS文件系统集群一样有Master和Slave两种角色，而HDFS的Master就是NameNode(NN)，在HDFS中还有一个SecondaryNameNode角色，Slave就是DataNode(DN)，其NameNode的作用就是管理整个文件系统的命令空间（储存数据的索引）和客户端对文件的访问（建立文件系统与外界进行交流），而Slave的作用就是以块的形式真正的储存数据。块(Block)是分布式文件系统的文件储存的逻辑单元，每一个块有对个副本（在不同的DataNode）上以达到容错效果。
分布式计算框架MapReduce是一个并行的编程计算框架，主要思想是将一个任务拆分为多个Mapper和Reducer阶段，从而达到一个输入一个输出，而却是分布式的计算处理，提高效率和利用率。
分布式资源调度YARN可以理解类似HDFS理解，也是一个主从架构模型，一个YARN有ResouceManager和NodeManager，分别映射YARN物理节点的主节点（资源调度和分配）和计算节点（常与DataNode一起）。ResourceManager节点的功能由Secheduler和ApplicationManager协调完成。NodeManager对应集群中的计算节点，但是他的功能仅仅只是抽象本节点的资源(如cpu，内存，磁盘，网络)并且定时向ResourceManager的Secheduler汇报。

ZooKeeper基础理论

ZooKeeper是一个分布式的协调框架，主要的分布式特性：顺序一致性、原子性、单一视图、可靠性、实时性。
简单来说ZooKeeper使得分布式程序能够通过一个共享的、树形结构的名字空间来进行相互协调，组成这个树形结构的数据节点被称作ZNode，它们之间的层级关系就像文件系统的目录结构一样；构建集群，也就是Zookeeper服务的可复制性，一般3-5(奇数)台机器就可以构建一个Zookeeper的集群，只要确保一半以上的服务器能够正常工作，整个机器就能够正常对外服务。相互之间可以进行通信，在内存中维护当前服务器状态，客户可以与任意一台服务器建立TCP连接进行通信，当与此服务器连接断开之后，客户端会自动连接到集群中的其他服务器继续工作；顺序访问，客户端的每一个更新请求ZooKeeper都会分配一个全局唯一的递增编号，通过这个编号可以确保事物操作的先后顺序；高性能，ZooKeeper将全量数据存储于内存之中，并直接服务于客户端的所有非事物请求，因此在读操作的应用上优势更为明显。可以在千台服务器组成的读写比例大约为10:1的分布系统上表现优异。
ZooKeeper的角色说明，主要有Leader(领导者)，其作用是为客户端提供读和写的服务，负责投票的发起和决议，更新系统状态；Follower（跟随者），其作用是为客户端提供读服务，如果是写服务则转发给Leader。在选举过程中参与投票；Observe（观察者），其作用是为客户端提供读服务器，如果是写服务则转发给Leader。不参与选举过程中的投票，也不参与“过半写成功”策略。在不影响写性能的情况下提升集群的读性能。此角色于ZooKeeper3.3版本以以后版本的新增角色。Client（客户端）连接zookeeper服务器的使用着，请求的发起者。独立于zookeeper服务器集群之外的角色。

准备工作

本章将从Hadoop的高可用HA搭建理论，主机的分配和角色分配，软件和硬件准备来进行阐述，做到环境搭建前的准备工作，以便于后面有条不紊的进行。

搭建理论

Hadoop高可用HA的部署，需要有2个NameNode，一个是活跃状态active的，一个是备用状态standby的，两个NameNode需要有一个管理员来协调管理，来决定决定谁处于active状态，谁处于standby状态，如果处于active状态的的NameNode宕机了，立即启动standby状态的NameNode转换为active状态，而这个具有协调功能的管理员就是ZooKeeper。
这样配置一主一从的主备NameNode之间通过一组JournalNode(JournalNode是Hadoop层面的，主流使用JournalNode集群进行数据共享)同步元数据信息，一条数据只要成功写入多数JournalNode即认为写入成功。通常配置奇数个JournalNode。同时为了满足高可用HA，那么，只有一个管理员ZooKeeper也不行，万一这个管理员坏了呢。所以需要配置一个ZooKeeper集群，同样只有一个JournalNode也不行，要配置多个JournalNode。

角色分配

集群规划

主机名	IP地址	软件安装	部署后运行的进程
master01	192.168.92.2	JDK、Hadoop	NN、RM、ZKFC
master02	192.168.92.2	JDK、Hadoop	NN、RM、ZKFC
slave01	192.168.92.2	JDK、Hadoop、ZooKeeper	DN、DM、JN
slave02	192.168.92.2	JDK、Hadoop、ZooKeeper	DN、DM、JN
slave03	192.168.92.2	JDK、Hadoop、ZooKeeper	DN、DM、JN

备注说明：

192.168.92.1作为这个集群网关的IP地址
NN：指的是NameNode；DN：指的是DataNode；JN：指的是JournalNode
RM：指的是ResourceManager；DM：指的是NodeManager
ZKFC：指的是ZKFailoverController

软件准备

JDK
Oracle的JDK下载官网点击这里
OpenJDK下载官网点击这里
jdk-8u201-linux-x64.tar.gz
Hadoop
Apache的Hadoop各个版本下载点击这里
hadoop-2.7.7.tar.gz
hadoop-3.2.0.tar.gz
CDH的Hadoop各个版本下载点击这里
在Chrome浏览器中，直接使用快捷键Ctrl+g启动页面搜索，输入hadoop回车即可查找到相关信息。注意版本的匹配问题（Hadoop版本、JDK版本和ZooKeeper版本之间的匹配支持问题）
hadoop-2.6.0-cdh5.13.2.tar.gz
hadoop-2.5.0-cdh5.2.0.tar.gz
ZooKeeper
Apache的ZooKeeper各个版本下载点击这里
apache-zookeeper-3.5.5.tar.gz
zookeeper-3.4.14.tar.gz

硬件准备

新建主机

master01——root——password——staticIP——domain——firewalld
master02——root——password——staticIP——domain——firewalld
slave01——root——password——staticIP——domain——firewalld
slave02——root——password——staticIP——domain——firewalld
slave03——root——password——staticIP——domain——firewalld

备注说明：
每一台主机配置好登录的用户名和密码，静态IP地址，主机名与IP地址的域名绑定，网卡信息的修改和防火墙的关闭(可以按需要关闭端口，也可以整个关闭防火墙)。
配置免密登录
先在每一台主机上执行生成RSA算法的秘钥

ssh-keygen –t rsa

从master01以root用户登录master01、master02、slave01、slave02、slave03免密。在master01主机上进行一下操作命令即可，其他主机类似操作即可，实现所有主机之间相互免密登录，都是在内部的局域网下，安全问题不考虑，这样操作方便，不需要考虑各个进行之间的通信问题。

ssh-copy-id -i ~/.ssh/id_rsa.pub root@master01
ssh-copy-id -i ~/.ssh/id_rsa.pub root@master02
ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave01
ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave02
ssh-copy-id -i ~/.ssh/id_rsa.pub root@slave03

环境搭建

本章将从JDK的安装配置，Hadoop的安装配置和ZooKeeper的安装配置来进行阐述，一步一步地按照集群的规划来部署好我们规划中的集群。

JDK安装

本节从JDK的下载、解压、环境变量和集群分发方面进行阐述

下载解压

将下载好的jdk版本上传到master01主机上(当前操作所在路径root用户目录下~)，指定解压到/usr/，命令如下

tar -zxvf jdk-8u201-linux-x64.tar.gz -C /usr/

环境变量

编辑系统的环境变量配置，将jdk添加到环境变量中，用vi/vim打开/etc/profile，并添加一下内容，然后保存退出，并重新生效一下环境变量。命令以内容如下

# VI/VIM命令
vim /etc/profile

# 添加一下内容
JAVA_HOME=/home/java/jdk1.8.0_131
JRE_HOME=$JAVA_HOME/jre
PATH=$PATH:$JAVA_HOME/bin
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export JAVA_HOME
export JRE_HOME
export PATH
export CLASSPATH

# 保存退出后重新生效环境变量
source /etc/profile

集群分发

配置好master01主机上的JDK后进行集群分发到master02、slave01、slave02和slave03。

scp –r /usr/jdk1.8.0_201/ root@master02:/usr/
scp –r /usr/jdk1.8.0_201/root@slave01:/usr/
scp –r /usr/jdk1.8.0_201/root@slave02:/usr/
scp –r /usr/jdk1.8.0_201/root@slave03:/usr/

分发master01主机上的环境变量配置文件

scp –r /etc/profile root@master02:~/
scp –r /etc/profile root@slaver01:~/
scp –r /etc/profile root@slaver02:~/
scp –r /etc/profile root@slaver03:~/

ZooKeeper安装

本节从ZooKeeper的下载、解压、环境变量和集群分发方面进行阐述

下载解压

将下载好的ZooKeeper版本上传到slaver01主机上(当前操作所在路径root用户目录下~)，指定解压到/usr/，命令如下

tar -zxvf zookeeper-3.4.14.tar.gz -C /usr/

环境变量

编辑系统的环境变量配置，将ZooKeeper(ZK)添加到环境变量中，用vi/vim打开/etc/profile，并添加一下内容，然后保存退出，并重新生效一下环境变量。命令以内容如下

# VI/VIM命令
vim /etc/profile

# 在末尾添加
export ZOOKEEPER_HOME=/usr/zookeeper-3.4.14
export PATH=$ZOOKEEPER_HOME/bin:$PATH
export PATH

# 保存退出后重新生效环境变量
source /etc/profile

修改配置文件

ZooKeeper的配置文件全部在$ZOOKEEPER_HOME/conf下，首先进入到这里配置文件路径下，然后查看所有的配置文件，对应着一个一个地配置。

# 进入ZK配置文件路径
cd $ZKHOME/conf

# 重命名配置文件
cp zoo_sample.cfg zoo.cfg

# 打开配置文件
vim zoo.cfg

# 修改内容
dataDir=$ZKHOME/tmp

# 在最后添加内容
server.1=slave01:2888:3888
server.2=slave02:2888:3888
server.3=slave03:2888:3888

# 保存退出后重新生效环境变量
source /etc/profile 

# 再在dataDir设置的位置创建一个空文件myid
touch dataDir/myid

# 最后向该文件写入唯一ID编码
echo 1 > $ZKHOME/tmp/myid

集群分发

配置好slave01主机上的zookeeper后进行集群分发到slave02和slave03。

# 集群分发
scp –r /usr/zookeeper-3.4.14/ root@slave02:/usr/
scp –r /usr/zookeeper-3.4.14/ root@slave03:/usr/

# 特别注意：修改slave02、slave03对应dataDir设置的位置/tmp/myid内容
# 在slave02：
echo 2 > $ZKHOME/tmp/myid
# slave03：
echo 3 > $ZKHOME/tmp/myid

分发slaver01主机上的环境变量配置文件

# 集群分发
scp –r /etc/profile root@slaver02:~/
scp –r /etc/profile root@slaver03:~/

# 可以用命令启动zookeeper
zkServer.sh start来启动

# 用命令来查看三个ZK集群上，哪个是leader，哪两个是follower
zkServer.sh status

Hadoop安装

本节从Hadoop的下载、解压、添加环境变量、修改配置文件和集群分发方面进行阐述

下载解压

将下载好的hadoop版本上传到master01进行解压(当前操作所在路径root用户目录下~)，指定解压到/usr/。

tar -zxvf hadoop-2.7.7.tar.gz -C /usr/

环境变量

用编辑器打开系统环境配置文件，用VI/VIM打开/etc/profile，然后添加一下内容，方便后面直接使用一些hadoop的shell命令，当然也是可以不用配置的，直接找到hadoop的shell命令所在路径，然后再执行shell命令，这样有时候不是很方便。

# vim打开/etc/profile
vim /etc/profile

# 文件尾部添加内容
export HADOOP_HOME=/usr/hadoop-2.7.7
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export PATH

修改配置文件

hadoop2.x的配置文件全部在$HADOOP_HOME/etc/hadoop下，首先进入到这里配置文件路径下，然后查看所有的配置文件，对应着一个一个地配置。

# 进入hadoop配置文件路径
cd $HADOOP_HOME/etc/hadoop

# 修改hadoop-env.sh
export JAVA_HOME=$JAVA_HOME

# 修改slaves文件，添加如下内容，作用是指定hadoop的datanode节点。
slave01
slave02
slave03

# 修改mapred-site.xml
<configuration>
  <!-- 指定mr框架为yarn方式 -->
  <property>
  	<name>mapreduce.framework.name</name>
	<value>yarn</value>
  </property>
</configuration>

修改配置文件core-site.xml

# 修改core-site.xml(其他property不改)
<configuration>
  <!-- 指定hdfs的nameservice为mycluster -->
  <!-- mycluster 后面配置hdfs.site要用到 -->
  <property>
  	<name>fs.defaultFS</name>
  	<value>mycluster</value>
  </property>
  
  <!-- 指定hadoop临时目录 -->
  <!-- 需要提前在指定路径创建好空目录tmp -->
  <property>
  	<name>hadoop.tmp.dir</name>
  	<value>/usr/hadoop-2.7.7/tmp</value>
  </property>
  
  <!-- 指定zookeeper地址 -->
  <property>
  	<name>ha.zookeeper.quorum</name>
  	<value>slave01:2181,slave02:2181,slave03:2181</value>
  </property>
</configuration>

修改配置文件hdfs-site.xml

# 修改hdfs-site.xml(其他property不改)
<configuration>
  <!--指定hdfs的nameservice为mycluster需要和core-site.xml中的保持一致 -->
  <property>
  	<name>dfs.nameservices</name>
  	<value>mycluster</value>
  </property>
  
  <!-- ns1下面有两个NameNode，分别是nn1，nn2 -->
  <property>
  	<name>dfs.ha.namenodes.mycluster</name>
  	<value>master01,master02</value>
  </property>
  
  <!-- nn1的RPC通信地址 -->
  <property>
  	<name>dfs.namenode.rpc-address.mycluster.nn1</name>
  	<value>master01:8020</value>
  </property>
  
  <!-- nn1的http通信地址 -->
  <property>
  	<name>dfs.namenode.http-address.mycluster.nn1</name>
  	<value>master01:50070</value>
  </property>
  
  <!-- nn2的RPC通信地址 -->
  <property>
  	<name>dfs.namenode.rpc-address.mycluster.nn2</name>
  	<value>master02:8020</value>
  </property>
  
  <!-- nn2的http通信地址 -->
  <property>
  	<name>dfs.namenode.http-address.mycluster.nn2</name>
  	<value>master02:50070</value>
  </property>
  
  <!-- 指定NameNode的元数据在JournalNode上的存放位置 -->
  <property>
  	<name>dfs.namenode.shared.edits.dir</name>
  	<value>qjournal://slave01:8485;slave02:8485;slave03:8485/mycluster</value>
  </property>
  
  <!-- 指定JournalNode在本地磁盘存放数据的位置 -->
  <property>
  	<name>dfs.journalnode.edits.dir</name>
  	<value>/usr/hadoop-2.7.7/journaldata</value>
  </property>
  
  <!-- 开启NameNode失败自动切换 -->
  <property>
  	<name>dfs.ha.automatic-failover.enabled</name>
  	<value>true</value>
  </property>
  
  <!-- 配置失败自动切换实现方式 -->
  <property>
  	<name>dfs.client.failover.proxy.provider.mycluster</name>
  	<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
  </property>	
  
  <!-- 配置隔离机制方法-->
  <property>
  	<name>dfs.ha.fencing.methods</name>
  	<value>sshfence</value>
  </property>
  
  <!-- 使用sshfence隔离机制时需要ssh免登陆 -->
  <property>
  	<name>dfs.ha.fencing.ssh.private-key-files</name>
  	<value>/root/.ssh/id_rsa</value>
  </property>
  
  <!-- 配置sshfence隔离机制超时时间 -->
  <property>
  	<name>dfs.ha.fencing.ssh.connect-timeout</name>
  	<value>30000</value>
  </property>
</configuration>

修改配置文件yarn-site.xml

# 修改yarn-site.xml
<configuration>
  <!-- Site specific YARN configuration properties -->
  <!-- 开启RM高可用 -->
  <property>
  	<name>yarn.resourcemanager.ha.enabled</name>
  	<value>true</value>
  </property>
  
  <!-- 指定RM的cluster id -->
  <!-- 该cluster-id不能与nameService相同-->
  <property>
  	<name>yarn.resourcemanager.cluster-id</name>
  	<value>yrc</value>
  </property>
  
  <!-- 指定RM的名字 -->
  <property>
  	<name>yarn.resourcemanager.ha.rm-ids</name>
  	<value>rm1,rm2</value>
  </property>
  
  <!-- 分别指定RM的地址 -->
  <property>
  	<name>yarn.resourcemanager.hostname.rm1</name>
  	<value>master01</value>
  </property>
  <property>
  	<name>yarn.resourcemanager.hostname.rm2</name>
  	<value>master02</value>
  </property>
  
  <!-- 启用RM重启的功能-->
  <property>  
    <name>yarn.resourcemanager.recovery.enabled</name>  
    value>true</value> 
  <!--description>启用RM重启的功能，默认为false</description-->
  </property> 
  
  <property>  
    <name>yarn.resourcemanager.store.class</name>  
  	<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value> 
  <!--description>用于状态存储的类，采用ZK存储状态类</description-->
  </property> 
  
  <!-- 指定zk集群地址 -->
  <property>
  	<name>yarn.resourcemanager.zk-address</name>
  	<value>slave01:2181,slave02:2181,slave03:2181</value>
  </property>
  
  <property>
  	<name>yarn.nodemanager.aux-services</name>
  	<value>mapreduce_shuffle</value>
  </property>
  
  <property>
    <name>yarn.resourcemanager.webapp.address.rm1</name>
    <value>master:8088</value>
  <!--description>提供给web页面访问的地址，可以查看任务状况等信息</description-->
  </property>
  
  <property>
    <name>yarn.resourcemanager.webapp.address.rm2</name>
    <value>hostbb:8088</value>
  <!--description>提供给web页面访问的地址，可以查看任务状况等信息</description-->
  </property>
  
  <!-- 配置通讯的地址和端口，有多少个RM就配置多少组property -->
  <!-- RM1-->
  <property>
    <name>yarn.resourcemanager.scheduler.address.rm1</name>
    <value>master01:8030</value>
  </property>
  <property>
    <name>yarn.resourcemanager.resource-tracker.address.rm1</name>
    <value>master01:8031</value>
  </property>
  <property>
    <name>yarn.resourcemanager.address.rm1</name>
    <value>master01:8032</value>
  </property>
  <property>
    <name>yarn.resourcemanager.admin.address.rm1</name>
    <value>master01:8033</value>
  </property>
  
  <!-- RM2 -->
  <property>
    <name>yarn.resourcemanager.scheduler.address.rm2</name>
    <value>master02:8030</value>
  </property>
  <property>
    <name>yarn.resourcemanager.resource-tracker.address.rm2</name>
    <value>master02:8031</value>
  </property>
  <property>
    <name>yarn.resourcemanager.address.rm2</name>
    <value>master02:8032</value>
  </property>
  <property>
    <name>yarn.resourcemanager.admin.address.rm2</name>
    <value>master02:8033</value>
  </property>
</configuration>

集群分发

配置好master01主机上的hadoop后进行集群分发到master02、slave01、slave02和slave03。

scp –r /usr/hadoop-2.7.7/ root@master02:/usr/
scp –r /usr/hadoop-2.7.7/root@slave01:/usr/
scp –r /usr/hadoop-2.7.7/root@slave02:/usr/
scp –r /usr/hadoop-2.7.7/root@slave03:/usr/

分发master01主机上的环境变量配置文件，这个环境变量记得每次配置完成后都要集群分发一次，并重新生效，也可以整个所有集群环境搭建好了之后，只需要集群分发一次并生效即可。

集群检测

格式化HDFS

在master01上执行分布式文件系统HDFS的格式化命令:

hdfs namenode -format

格式化后会在根据core-site.xml中的hadoop.tmp.dir配置生成个文件，这里我配置的是 $HADOOP_HOME/tmp，然后将$ HADOOP_HOME/tmp拷贝到#master02的$HADOOP_HOME下。

# 格式化主从NameNode
scp -r tmp/ master02:$HADOOP_HOME

# 建议使用命令进行主从NameNode格式化
# 在执行此命令前先启动master01的namenode：sbin/hadoop-daemon.sh start namenode 
hdfs namenode -bootstrapStandby

# 格式化ZKFC
# 格式化ZKFC(在master01上执行即可)
hdfs zkfc -formatZK
# 或者直接到hadoop的bin和sbin下调相应命令
bin/hdfs zkfc -formatZK

启动集群

# 在zookeeper的三个节点上执行命令启动zookeeper
zkServer.sh start

# 然后在master01上执行启动HDFS、YARN
start-dfs.sh
start-yarn.sh

集群检测

检测进程
在每一台主机上执行jps命令，查看运行在Java虚拟机KVM的进程。可以采用批量化命令，即打开远程连接软件的交互窗口，只输入一次命令在所有主机上都运行该命令，然后根据每一台主机运行后的进程和我们预先的进程是否一致，若相同则集群成功了。
检测浏览器访问

# 查看分布式文件系统HDFS
http://192.168.92.2:50070
NameNode 'master01:9000' (active)
http://192.168.92.3:50070
NameNode 'master02:9000' (standby)

#查看分布式资源调度YARN任务信息（ResourceManager运行节点的IP）
http://192.168.92.2:8088(端口号是上面文件中配置的,默认是8088)

测试集群的高可用性

# 先向hdfs上传一个文件
hadoop fs -put /etc/profile /
hadoop fs -ls /

# 然后再kill掉active的NameNode
kill -9 <pid of NN>

# 通过浏览器访问：http://192.168.92.3:50070
# NameNode 'master02:9000' (active)
# 这个时候master02上的NameNode变成了active

# 在执行命令,发现刚才上传的文件依然存在
hadoop fs -ls /

# 手动启动那个挂掉的NameNode
sbin/hadoop-daemon.sh start namenode

# 通过浏览器访问：http://192.168.92.2:50070
NameNode 'weekend01:9000' (standby)

出错问题QA

Q：不能完成主备NameNode节点之间的自动切换？
A：查看配置hdfs-site.xml密匙文件位置是否配置正确！

Q：出现找不到命令的情况？
A：看环境变量是否配置好了，或者直接到hadoop的bin和sbin下调相应命令！

Q：出现访问不了哪一个节点？
A：节点之间是要相互通信的，所以要检查在各节点之间配置ssh免密登陆！

Q：出现找不到主机名错误提示？
A：查看主机名与IP的映射域名文件/etc/hosts是否配置准确！注意配置文件/etc/sysconfig/network配置的是该主机的主机名！

Q：运行过程中出现莫名其妙错误？
A：首先应该检查一下集群的必要进程是否还在，有可能莫名其妙的在后台挂掉了！

Q：浏览器访问出现端口冲突？
A：所有进行的HTTP端口或者RPC通信端口采用默认方式，如果有冲突则修改端口即可！

Q：感觉看到不是很懂的，感觉有错误的？
A：首先本篇文章要求读者有一定的Linux基础和Hadoop集群基础，然后可能版本的原因，部分配置信息有不同，详情请以官方配置文档为主！

你可能感兴趣的:(Hadoop,分布式,hadoop,大数据,zookeeper,hdfs)

GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
【Death Note】网吧战神之7天爆肝渗透测试死亡笔记_sqlmap在默认情况下除了使用 char() 函数防止出现单引号 2401_84561374 程序员笔记
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！特殊服务端口2181zookeeper服务未授权访问
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
大模型训练数据库Common Crawl WindyChanChan 数据集语言模型数据库
CommonCrawl介绍‌‌CommonCrawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。CommonCrawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌CommonCrawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据
慢速连接攻击是什么？慢速连接攻击怎么防护？快快小毛毛网络 ddos 服务器
慢速连接攻击（SlowConnectionAttack），又称慢速攻击（SlowlorisAttack），是一种网络攻击技术，旨在通过占用服务器上的所有可用连接资源来使其无法响应正常请求。与传统的拒绝服务（DoS）和分布式拒绝服务（DDoS）攻击不同，慢速攻击并不依赖于发送大量数据包来消耗带宽，而是利用HTTP、TCP或SSL等协议的特性，通过发送大量不完整的请求或缓慢发送数据来占用服务器资源，使
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
Gobelieve 架构 weixin_34099526 数据库 golang json
Gobelievegithub地址声明:转简书JackieF的文章,为了自己方便copy了一份,加一些自己的东西.链接：https://www.jianshu.com/p/8121d6e85282IMCore主要分三大块:im客户连接服务器（可分布式部署，暂无负载均衡模块)imr路由查询服务器（主要解决im分布式部署的问题）ims存储服务器(主从部署)基础模块1.数据包协议包：header(12)
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
疫情，疫情东山草
2020年，疫情爆发，至今已近三年，反反复复，此起彼伏。不但没被消灭，还自我发展，从德尔塔到奥密克戎，与时俱进的变异着。去年11月，疫情之下，大数据800米范围内，都成为时空伴随者。“你的码儿有没有变颜色”“你绿码还是黄码”成为那段时间的流行语，当然少不了的还有全员核酸。段子手整出来一首歌：我走过你走过的路,这算不算相逢？我吹过你吹过的风，这算不算相拥？800米内我们不曾擦肩而过，你却要我14天相
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
Kafka 基础与架构理解 StaticKing KAFKA kafka
目录前言Kafka基础概念消息队列简介：Kafka与传统消息队列（如RabbitMQ、ActiveMQ）的对比Kafka的组件Kafka的工作原理：消息的生产、分发、消费流程Kafka系统架构Kafka的分布式架构设计Leader-Follower机制与数据复制Log-basedStorage和持久化Broker间通信协议Zookeeper在Kafka中的角色总结前言Kafka是一个分布式的消息系
Rides实现分布式锁，保障数据一致性,Redisson分布式事务处理朱杰jjj 缓存分布式
分布式环境下分布式锁有三种方式：基于数据库分布式锁基于Redis分布式锁基于zk分布式锁本帖只介绍Redis分布式锁为什么需要用到分布式锁？在单机环境下一个服务中多个线程对同一个事物或数据资源进行操作时，可以通过添加加锁方式（synchronized和lock）来解决数据一致性的问题。但是如果出现多个服务的情况下，这时候我们在通过synchronized和lock的方式来加锁会出现问题，因为多个服
机电综合管理系统架构小熊coder 机载系统系统架构
文章目录一、机电综合管理系统架构1.系统概述2.架构层次3.核心组件二、余度管理1.余度概述2.硬件冗余3.软件冗余4.通信冗余三、总线架构1.MIL-STD-1553B总线2.ARINC429总线3.ARINC629总线4.AFDX/ARINC664总线四、未来发展趋势1.分布式架构2.高速网络3.智能化与自动化结语机电综合管理系统（ElectromechanicalManagementSyst
华为云分布式缓存服务DCS与开源服务差异对比 hcinfo_18 redis使用华为云 Redis5.0 分布式缓存服务 Redis客户端
分布式缓存服务DCS提供单机、主备、集群等丰富的实例类型，满足用户高读写性能及快速数据访问的业务诉求。支持丰富的实例管理操作，帮助用户省去运维烦恼。用户可以聚焦于业务逻辑本身，而无需过多考虑部署、监控、扩容、安全、故障恢复等方面的问题。DCS基于开源Redis、Memcached向用户提供一定程度定制化的缓存服务，因此，除了拥有开源服务缓存数据库的优秀特性，DCS提供更多实用功能。一、与开源Red
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
Dubbo架构概览：服务注册与发现、远程调用、监控与管理木南曌 dubbo 架构
Dubbo是一个成熟的、高性能的、基于Java的微服务开发框架，它主要用于解决分布式系统中的服务治理问题，包括服务的注册与发现、远程过程调用（RPC）、服务监控与管理等多个关键环节。以下是Dubbo架构概览的详细介绍：服务注册与发现Dubbo的服务注册与发现机制是其核心功能之一，它依赖于注册中心来管理服务的生命周期和定位服务提供者。1.服务提供者（Provider）服务提供者是实际提供服务的节点，
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号