Dectwelve

Hadoop HA高可用安装过程和wordcount实例

一、HA介绍

HA是为解决HDFS中单点故障。
高可用通过主备NameNode来解决问题，如果当NameNode（active）发生故障，则切换到备用NameNode（standby）上。

DateNode中数据时间等发生变化（不断）都要跟NameNode汇报，为了防止单点故障，所以我们用HA高可用方式。

我们准备两台NameNode,一台正在工作(active)的NameNode,一台备用(standby)的NameNode。如果NameNode(active)故障了，standby状态的NameNode变为active状态的NameNode，active状态的NameNode变为standby状态的NameNode。这一种转换是由JournalNode管理。

JournalNode是用来管理NameNode资源共享。当JournalNode发现NameNode有问题，就切换NameNode的当前状态。
JournalNode不放一台：JournalNode如果一台出故障了，跟只有一台NameNode一样，数据都没有了，也不安全。
JournalNode放三台：过半原则。

ZooKeeper管理JournalNode,NameNode。不用手动改变它们standy和active状态。并且它有两个进程：Failover Controller Active和Failover Controller Standby监视NameNode。

如果NameNode（active ）挂了，Failover Controller Active就汇报给ZooKeeper，ZooKeeper发现NameNode（active ）挂了，就检查Failover Controller是不是standby准备好了，如果准备好了就将NameNode（active )自动切换成NameNode（standby)。每个NameNode都有一个ZooKeeperFailoverController监视。

我们的安装方案如下图。只有三台的，将NN-2也放在node01,DN在node02,node03

二、前期准备！！！

准备 四台虚拟机 ，且四台虚拟机能相互ping通。可根据这个链接学习https://blog.csdn.net/Dlychee/article/details/106756219

并且要将 Xshell和Xftp连接虚拟机 ，可根据这个链接学习https://blog.csdn.net/Dlychee/article/details/106756519

知识点1：按“i”编辑文件，编辑完内容后，按“Esc”键，然后输入“:wq”为保存编辑内容并退出，输入“:q!”为不保存编辑内容并退出。

知识点2：在敲当前目录下文件名的时候可以按 Tab 键，它会自动帮你补全文件名。

（一）、安装jdk

这里给一个jdk-7u67-linux-x64.rpm
网盘链接: https://pan.baidu.com/s/1cwuoJLPcclQEKwJSqaNMIQ
提取码：688f

我们将四台虚拟机都开启且与Xshell连接上。

首先配置node01虚拟机的jdk，在node01上操作以下步骤

1.将在Windows中的jdk.rpm文件传输给node01。 (rpm相当于Windows的exe文件）

（右边部分为虚拟机中root目录下）
首先，单击“新建文件传输”。然后，在左边部分找到在Windows下jdk-7u67-linux-x64.rpm文件，右键，单击“传输”。

2.输入命令

rpm -i jdk-7u67-linux-x64.rpm

3.查询jdk安装路径

whereis java

4.配置全局环境变量
（1）进入profile中进行编辑的命令，“vi + 文件路径”表示打开文件，并将光标置于最后一行首。

vi + /etc/profile

按“i”编辑文件，编辑完内容后，按“Esc”键，然后输入“:wq”为保存编辑内容并退出，输入“:q!”为不保存编辑内容并退出。（后面将不再重复此知识点。）

（2）在它最后插入：

export JAVA_HOME=/usr/bin/java
export PATH=$PATH:$JAVA_HOME/bin

5.使环境变量生效（每次修改过/etc/profile文件后记得一定要source一下）

source /etc/profile

6.输入命令jps,如果出现-bash: jps: command not found

（1）此时更改环境变量，输入命令：

vi + /etc/profile

（2）更改刚刚前面输入的内容：

export JAVA_HOME=/usr/bin/java
export PATH=$PATH:/usr/java/jdk1.7.0_67/bin

（3）使环境变量生效

source /etc/profile

（4）再次输入命令jps,查看是否出现Jps

这时候我们虚拟机中 node01中的jdk安装成功。

开始配置node02，node03,node04虚拟机的jdk
7.现在我们将node01中的jdk分发给node02，node03，node04中。

在虚拟机node01中，我们cd到存放jdk.rpm文件的目录下（这里我们的jdk刚刚放在了根目录中，所以cd ~），然后输入以下命令将jdk发送给node02:

scp jdk-7u67-linux-x64.rpm node02:'pwd'

scp是发送命令，pwd是当前目录。即将jdk-7u67-linux-x64.rpm文件发送给node02的当前目录下。

不要忘了还要发送给node03,node04。

scp jdk-7u67-linux-x64.rpm node03:'pwd'
scp jdk-7u67-linux-x64.rpm node04:'pwd'

8.查看node02,node03,node04是否接收到jdk-7u67-linux-x64.rpm。

（1）我们将Xshell软件的右下角的 “三” 图标单击一下，然后选择全部会话。

（2）在Xshell全部会话框中输入 ll ，然后按“Enter”键。来查看jdk是否传输成功。

当每台虚拟机中都出现jdk-7u67-linux-x64.rpm，则证明传输成功。

如果没有显示jdk-7u67-linux-x64.rpm,有可能是虚拟机之间不能ping通。

9.分别在node02,node03,ndoe04上执行rpm安装命令。

rpm -i jdk-7u67-linux-x64.rpm

10.在node01上cd /etc，在此目录下把profile文件分发到node02、node03、node04上。

scp profile node02:`pwd`
scp profile node03:`pwd`
scp profile node04:`pwd`

11.看node02、node03、node04这三台机子的jdk是否装好

（1）利用Xshell全部会话栏输入source /etc/profile
（2）利用Xshell全部会话栏输入jps
在每台虚拟机中我们可以看到 jps 进程启动，则四台虚拟机的jdk安装成功。

（二）、同步所有服务器时间

1.查看每台虚拟机当前时间。（时间不能差太大，否则集群启动后某些进程跑不起来。）
利用Xshell全部会话栏输入命令 date，看四台虚拟机当前时间，一不一样。

2.时间不同步，我们可以做一下操作。（不管时间同步同步，这里建议都执行一遍以下操作。）

（1）用yum安装时间同步器。

利用Xshell全部会话栏输入

yum -y install ntp

当最后显示“Complete!”安装完成。

（2）执行时间同步命令。
这里我们做和阿里云第一台服务器时间同步。（做这个的前提是虚拟机ping外网能ping通，例如ping www.baidu.com能成功。）

利用Xshell全部会话栏输入

ntpdate time1.aliyun.com

3.再次查看每台虚拟机当前时间。
利用Xshell全部会话栏输入命令 date，看四台虚拟机当前时间，一不一样。

（三）、配置文件检查

1.查看四台虚拟机的HOSTNAME是否正确。
cat为查看命令，我们的hostname存放在/etc/sysconfig/network路径中。

利用Xshell全部会话栏输入命令

cat /etc/sysconfig/network

这里给出node01和node02截图

如果不正确可以输入命令vi /etc/sysconfig/network来更改。

2.查看四台虚拟机IP映射是否正确。

利用Xshell全部会话栏输入命令

cat /etc/hosts

这里给出node01和node02截图，查看最后四行，IP和主机名是否一一对应。
如果不正确，可以输入命令vi /etc/hosts来更改。

3.查看四台虚拟机中SELINUX=disabled

利用Xshell全部会话栏输入命令

cat /etc/sysconfig/selinux

如果不正确，可以输入命令vi /etc/sysconfig/selinux来更改。

4.查看四台虚拟机的防火墙是否关闭。

利用Xshell全部会话栏输入命令

service iptables status

显示Firewall is not running,则证明防火墙关闭。

没有关闭则输入命令service iptables stop

（四）、查询.ssh文件

1.四台虚拟中在根目录（即cd ~）中查看是否有 .ssh 文件

利用Xshell全部会话栏输入命令ll -a

2.哪一台虚拟机里没有 .ssh文件 ，则就在该台虚拟机中输入命令 ssh localhost

遇到问(yes/no)输入 yes ，遇到password输入你的 密码 。ssh登录完后记得最后要退出登录，输入命令 exit

3.再次输入命令 ll -a，看 .ssh 文件是否出现。

（五）、设置免密

（五.1）、四台虚拟机自身的免密钥

这里以node01为例，其它三台免密步骤相同
1.输入命令：（P为大写）

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

2.把id_dsa.pub追加到authorized_keys。

输入命令：

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

3.免密验证（此次ssh localhost不需要输入密码）

（1）输入命令 ssh localhost，记得要退出登录 exit

（2）输入命令 ssh node01，记得要退出登录 exit

4.这个时候我们输入命令 ll，就可以看到 .shh目录中有以下几个文件。

不要忘了其它三台虚拟机也要免密钥！！！到各自对应的虚拟机中执行刚刚的步骤，完成免密钥配置。

（五.2）、NN-1与其它三台台虚拟机免密钥

当四台虚拟机都自身免密钥成功后，我们让NN-1与三台DN免秘钥设置。这样NN-1可以快速访问DN
我们这里设置node01为NN-1所以我们现在将node01的公钥发送给其它三台虚拟机。

1.首先我们要进入.ssh目录下。

利用Xshell全部会话栏输入命令cd /root/.ssh

2.然后在虚拟机node01中，输入以下命令。

scp id_dsa.pub node02:`pwd`/node01.pub
scp id_dsa.pub node03:`pwd`/node01.pub
scp id_dsa.pub node04:`pwd`/node01.pub

3.传输完成后，我们 分别到node02,node03,node04虚拟机 中的 .ssh目录 查看是否存在node01.pub。并且分别依次输入命令cd /root/.ssh和ll即可查看。

这里给一个node02的截图

4.如果有node01.pub，我们就将它追加到authorized_keys中，使其它三台虚拟机可以获取node01公钥的权限。

分别在node02,node03,node04虚拟机上输入命令

cat node01.pub >> authorized_keys

这里给一个node02的截图

5.验证在node01中我们是否可以免密钥登录node02,node03,node04三台虚拟机。

首先，我们回到node01虚拟机中，依次输入一下命令,每次ssh登录成功后，不要忘了exit退出登录。如果登录时不再需要输入密码，则表示由node01到其它三台虚拟机免密成功。

ssh node02
exit
ssh node03
exit
ssh node04
exit

（五.3）、两个NameNode之间相互免密钥

在HA高可用中，我们有两个NameNode，它们需要时常相互传输数据，以保持两个NN中数据相同，防止其中一台挂了之后，出现故障，所以我们要使这两个NN也相互免密钥一下。

我们这里设置node01和node02为NameNode，现在需要node01与node相互免密登录。刚刚我们实现了在node01上免密登录node02，现在只需做在node02上免密登录node01。

1.我们在node02的虚拟机上，验证一下刚刚前面 （五.1） 中是否实现了对自身的免密。验证方式如下：输入ssh localhost ，如果不需要密码登录，则免密成功，记得最后不要忘了退出登录exit

2.node02自身免密成功后，我们 cd /root/.ssh 到 .ssh目录 下将它的id_dsa.pub公钥发送给node01。

scp id_dsa.pub node01:`pwd`/node02.pub

3.我们在node01虚拟机上， cd /root/.ssh 到 .ssh目录 下，并且ll一下，我们可以看到node02.pub这个公钥文件。

4.如果有node02.pub，我们就可以把它追加到authorized_keys中，使node01虚拟机可以获取node02公钥的权限。

在node01虚拟机的.ssh目录上输入命令

cat node02.pub >> authorized_keys

5.验证在node02上是否可以免密登录node01。

我们现在到ndoe02的虚拟机上，依次输入以下命令,每次ssh登录成功后，不要忘了exit退出登录。如果登录时不再需要输入密码，则表示由node02到node01免密成功。

ssh node01
exit

这就是我们现在所完成的免密关系图。

三、安装Hadoop并配置文件信息

提供一个绿色版本hadoop-2.6.5，解压就能用。
网盘链接: https://pan.baidu.com/s/1tPnm0hhr0w3yGFNX1nBJwg
提取码：zbqq

（一）、在node01中安装Hadoop

1.首先，我们要在虚拟机主目录下建立一个新的目录用来等下来存放hadoop的压缩包，这里我取的文件名是software

到主目录的命令为 cd  ~
新建目录的命令为 mkdir 文件名

2.将Windows中hadoop压缩包传到虚拟机node01中。

单击“新建文件传输”图标，右边虚拟机进入刚刚创建的software目录中，在Windows(即本地）中找到存放hadoop-2.6.5的压缩包，右键，选择“传输”。

3.到opt目录下（该本身就存在，不需要我们创建），创建一个新的目录用来等下存放hadoop解压后的文件.这里我取的目录名为lychee,大家可以用自己的名字命名（例如：陈芊芊→cyy)
记住这个文件名，我们下面会经常用到它

到opt目录下命令为 cd /opt
新建目录的命令为 mkdir 文件名

4.解压hadoop压缩包。

（1）首先到存放hadoop压缩包的目录(software)下。

cd /root/software

（2）将 hadoop压缩包解压到 lychee 目录（刚刚以自己名字命名的目录）下。

（注：C为大写）

tar xf hadoop-2.6.5.tar.gz -C /opt/lychee

（3）这个时候我们在 lychee 目录下输入命令 ll 就能看到已经解压好的hadoop。

5.想要在任意目录下启动Hadoop，我们需要在配置文件profile中做一些修改。

（1）进入profile中进行编辑的命令，“vi + 文件路径”表示打开文件，并将光标置于最后一行首。

 vi + /etc/profile

（2）对它进行配置，配置成功后保存并退出。配置内容如下：

export JAVA_HOME=/usr/java/bin
export HADOOP_HOME=/opt/自己的文件名/hadoop-2.6.5
export PATH=$PATH:usr/java/jdk1.7.0_67/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

（3）修改过/etc/profile文件后，不要忘了source一下

source /etc/profile

6.输入hd后，按Tab键可以出现hdfs 和输入start-d后，按Tab键可以出现start-dfs. 就表示成功了。

（二）、在node01中配置文件信息

配置文件信息要仔细！！！！要不然后续很容易出错！！

1.首先到hadoop目录下：

cd /opt/lychee/hadoop-2.6.5/etc/hadoop

然后，我们 ll 一下，会看到很多配置文件。

2.配置hadoop-env.sh文件

vi hadoop-env.sh

给它的JAVA_HOME更改成绝对路径/usr/java/jdk1.7.0_67，并且保存退出。

3.配置mapred-env.sh文件

vi mapred-env.sh

给它的JAVA_HOME更改成绝对路径/usr/java/jdk1.7.0_67，并且保存退出。(注：这里export JAVA_HOME这句开头有一个注释号 #，我们需要把这个#删掉。）

4.配置yarn-env.sh文件

vi yarn-env.sh

给它的JAVA_HOME更改成绝对路径/usr/java/jdk1.7.0_67，并且保存退出。(注：这里export JAVA_HOME这句开头也有一个注释号 #，我们需要把这个#删掉。）

5.配置hdfs-site.xml文件

vi hdfs-site.xml

在里面配置信息,然后保存并退出。



	
    
        dfs.replication
        3
    
    
    
    
        dfs.nameservices
        mycluster
    
    
    
    
        dfs.ha.namenodes.mycluster
        nn1,nn2
    

	
    
        dfs.namenode.rpc-address.mycluster.nn1
        node01:8020
    
    
        dfs.namenode.rpc-address.mycluster.nn2
        node02:8020
    
    
        dfs.namenode.http-address.mycluster.nn1
        node01:50070
    
    
        dfs.namenode.http-address.mycluster.nn2
        node02:50070
    
    
    
    
        dfs.namenode.shared.edits.dir
        qjournal://node01:8485;node02:8485;node03:8485/mycluster
    

    
    
        dfs.journalnode.edits.dir
        /var/lychee/hadoop/ha/jn
    

    
    
        dfs.client.failover.proxy.provider.mycluster
        org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
    
    
   
    
        dfs.ha.fencing.methods
        sshfence
    
    
    
    
        dfs.ha.fencing.ssh.private-key-files
        /root/.ssh/id_dsa
    

   
    
        dfs.ha.automatic-failover.enabled
        true
    
    
    
    
        dfs.ha.fencing.ssh.connect-timeout
        30000
    
    
    
    
        dfs.name.dir
        /data/hadoop/tmp/dfs/name
    
    
    
    
        dfs.data.dir
        /data/hadoop/tmp/dfs/data

注意：配置信息里用自己主机名，例如：我这里用的node01,node02,node03,node04,大家自己四台虚拟机的主机名是什么要一一对应修改。

6.配置core-site.xml文件

vi core-site.xml

在里面配置信息,然后保存并退出。



    
        fs.defaultFS
        hdfs://mycluster
    

    
        ha.zookeeper.quorum
        node02:2181,node03:2181,node04:2181

NameNode的元数据信息和DateNode数据文件本来默认保存在一个临时tmp文件里，这样不安全，所以更改它的Hadoop的临时目录

7.配置slaves文件

vi slaves

在里面删除原有的 localhost ，添加当前DateNode节点 所在的 虚拟机主机名。然后保存并退出。这里我们配置的是（DateNode节点）。

（三）、其他三台虚拟机中Hadoop的安装和配置文件

我们已经在node01这台虚拟机中将Hadoop安装好和配置好相关文件。现在我们从node01中将这些信息分发给其他三台虚拟机，这样我们就不需要像node01中那么麻烦的安装和配置Hadoop。

1.利用Xshell全部会话栏输入命令cd /opt

2.在node01虚拟机上，将opt目录下，以自己名字命名的目录（我的是lychee）分发给ndoe02,node03,node04中。

scp -r lychee/ node02:`pwd`
scp -r lychee/ node03:`pwd`
scp -r lychee/ node04:`pwd`

3.查看/opt/lychee是否传输成功。

首先，利用Xshell全部会话栏输入命令cd /opt/lychee。
然后，利用Xshell全部会话栏输入命令ll。

这时候查看每台虚拟机上，是否有hadoop-2.6.5

四、安装ZooKeeper并配置文件信息

提供一个zookeeper-3.4.6.tar。
网盘链接: https://pan.baidu.com/s/1VP_XxGz8lZ7o5ztPHQSVSA
提取码：lptw

（一）、在node02中安装zookeeper

1.首先，我们要在node02虚拟机主目录下建立一个新的目录用来等下来存放zookeeper的安装包，这里我取的文件名是software

到主目录的命令为 cd  ~
新建目录的命令为 mkdir 文件名

2.将Windows中zookeeper压缩包传到虚拟机node02中。

单击“新建文件传输”图标，右边虚拟机进入刚刚创建的software目录中，在Windows(即本地）中找到存放zookeeper-3.4.6.tar的安装包，右键，选择“传输”。

3.解压zookeeper压缩包。

（1）首先到存放zookeeper压缩包的目录(software)下。

cd /root/software

（2）将 zookeeper压缩包解压到 lychee 目录（刚刚以自己名字命名的目录）下。

（注：C为大写）

tar xf zookeeper-3.4.6.tar.gz -C /opt/lychee

（3）这个时候我们在 lychee 目录下输入命令 ll 就能看到已经解压好的zookeeper。

（二）、在node02中配置文件信息

配置文件信息要仔细！！！！要不然后续很容易出错！！

1.首先到/opt/lychee/zookeeper-3.4.6/conf目录下：

cd /opt/lychee/zookeeper-3.4.6/conf

然后，我们 ll 一下，会看到有一个zoo_sample.cfg文件。

2.我们要配置一下zoo_sample.cfg文件，以防我们将它修改坏了，现在我们拷贝一下zoo_sample.cfg这个文件，拷贝出来的新文件命名为zoo.cfg。然后我们在拷贝出的zoo.cfg这个文件中配置信息。

用以下命令来实现：

cp zoo_sample.cfg zoo.cfg

然后我们ll一下，发现zoo.cfg拷贝成功。

3.配置zoo.cfg文件

vi zoo.cfg

（1）修改dataDir=/var/自己名字命名的目录/zk，这里我修改的是dataDir=/var/lychee/zk

（2）并在文件末尾追加

server.1=node02:2888:3888
server.2=node03:2888:3888
server.3=node04:2888:3888

2888是主从通信端口，3888是当主挂断后进行选举机制的端口。

（三）、其他两台虚拟机中ZooKeeper的安装和配置文件

我们已经在node02这台虚拟机中将ZooKeeper安装好和配置好相关文件。现在我们从node02中将这些信息分发给其他两台虚拟机，这样我们就不需要像node02中那么麻烦的安装和配置ZooKeeper。

1.利用Xshell全部会话栏输入命令cd /opt/lychee

2.在node02虚拟机上，将 zookeeper-3.4.6 分发给node03,node04中。

scp -r zookeeper-3.4.6/ node03:`pwd`
scp -r zookeeper-3.4.6/ node04:`pwd`

3.查看zookeeper-3.4.6是否传输成功。

首先，利用Xshell全部会话栏输入命令cd /opt/lychee。
然后，利用Xshell全部会话栏输入命令ll。

这时候查看node03,node04两台虚拟机上，是否有zookeeper-3.4.6

这里给出node03的截图

4.给node02,node03,node04虚拟机创建刚配置文件的路径。

分别在node02,node03,node04三台虚拟机中，输入命令:
p是小写 (我的是mkdir -p /var/lychee/zk）

mkdir -p /var/自己名字命名的目录/zk

5.给每台机子配置其编号（必须是阿拉伯数字）
注意： 再次强调lychee是你自己名字命名的那个文件
（1）首先，我们要在node02,node03,node04三台虚拟机中分别敲这个命令：cd /var/lychee/zk

（2）
在node02虚拟机上：

echo 1 > /var/lychee/zk/myid
cat /var/lychee/zk/myid

在node03虚拟机上：

echo 2 > /var/lychee/zk/myid
cat /var/lychee/zk/myid

在node04虚拟机上：

echo 3 > /var/lychee/zk/myid
cat /var/lychee/zk/myid

6.配置/etc/profile

（1）在node02虚拟机上，我们输入命令：vi + /etc/profile可以看到末尾有这三行配置。
（2）现在我们对它们进行添加和更改。

export JAVA_HOME=/usr/java/jdk1.7.0_67
export HADOOP_HOME=/opt/自己名字命名的文件/hadoop-2.6.5
export ZOOKEEPER_HOME=/opt/自己名字命名的文件/zookeeper-3.4.6
export PATH=$PATH:/usr/java/jdk1.7.0_67/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin

（3）编辑过profile的文件后，不要忘了source一下。

source /etc/profile

（4）在node02虚拟机上，我们将**/etc/profile**分发到node03，node04虚拟机上。

scp /etc/profile node03:/etc
scp /etc/profile node04:/etc

因为node02与node03,node04没有相互免密，所以node02发送文件给node03,node04是需要输密码的。

这里给一个由node02传送文件给node03的截图

（5）/etc/profile分发成功后，我们在node03和node04两台虚拟机中也要刷新重读一遍/etc/profile。
所以，在node03,node04中都要执行这条命令：source /etc/profile

（6）验证是否完成。
在node02,node03,node04分别输入zkCli.s,然后按Tab键可以把名字补全为zkCli.sh。这条命令不需要执行。

这时候我们在node02,node03,node04中zookeeper安装结束。

五、启动ZooKeeper

zookeeper启动命令在任何目录下都可以执行。

1.利用Xshell全部会话栏输入命令zkServer.sh start。
在node02，node03, node04虚拟机中显示zookeeper已开启：Starting zookeeper ... STARTED

这里给一个node02的截图
node01中我们没有安装zookeeper，所以node01中会显示没有找到这个命令。结果如下图：

2.显示了Starting zookeeper … STARTED，我们也不能确定zookeeper是否真正的开启，它有可能是一个假象。现在让我们查看每个zookeeper节点的状态，来确定zookeeper是否真正的开启。

利用Xshell全部会话栏输入命令zkServer.sh status。

在node02,node03,node04三台虚拟机中，有两台的状态是 follower，一台状态是 leader。（这三台虚拟机的状态没有规定哪个状态一定是follower或者leader。只要确保两台是follower和一台是leader）

3.如果出现了状态是 standalone，那么在出现该状态的虚拟机中输入命令：jps查看进程。然后，杀死现在被QuorumPeerMain占领的进程。执行命令 kill -9 进程号 。

例如，下面这张图的情况，我们执行**kill -9 1237** 。

六、启动journalnode

为了使两台namenode之间完成数据同步，我们要启动journalnode。
我们这里将journalnode放在node01,node02,node03三台虚拟机上。为什么放在这三台虚拟机上呢？
因为我们journalnode是用来管理namenode的，还用一台用来备用。

1.分别在node01,node02,node03虚拟机上启动journalnode。

hadoop-daemon.sh start journalnode

2.分别在node01,node02,node03虚拟机上，用 jps命令 检查一下进程，看journalnode有没有启动成功。

这里给一个node02虚拟机的截图，当出现JournalNode的进程的时候，证明启动成功。

七、启动namenode

（一）、格式化任一台namenode

1.随意挑一台namenode上执行 hdfs namenode –format。
另一台namenode不用执行，否则clusterID变了，就找不到集群了。这里我在node01上执行格式化。

2.然后，在刚刚格式化的那台namenode中（这里我是node01上），我们敲命令：

hadoop-daemon.sh start namenode

然后jps一下，会出现NameNode的进程。

（二）、给另一台namenode同步数据

1.现在我们给另一台namenode同步一下数据，这样好让两台namenode进行数据交互。这里我们的另一台namenode是node02。
在node02虚拟机上，我们执行命令：

hdfs namenode -bootstrapStandby

2.格式化zkfc。

回到node01虚拟机上，我们执行命令：

hdfs zkfc -formatZK

3.打开zookeeper客户端，查看hadoop-ha是否打开。

（1）首先，执行下图步骤。

（2）在刚刚新打开的node02上，我们执行命令：

zkCli.sh

当这个命令执行完之后，我们还是在这个新打开的node02上，我们执行命令：

ls /

看是否出现hadoop-ha。

八、启动hdfs集群

如果那个节点没起来到hadoop目录下去看那个node的日志文件log

1.在node01虚拟机上，启动hdfs集群，输入命令：start-dfs.sh

2.利用Xshell全部会话栏输入命令jps，查看进程。
四台虚拟机的进程如下。

九、在windows环境看Hadoop集群

在集群启动的情况下，我们在浏览器（不要用360浏览器，这里我用火狐）中搜索有 namenode节点的虚拟机主机名：50070，这里我搜的是node01:50070和
node02:50070

一台红框内显示active，一台显示standby,则成功。没有规定哪一台一定是active，那一台是standby。

这时候我们的hdfs算是搭建成功了。

十、MapReduce前期准备

（一）、配置文件

1.首先我们要关闭集群，在node01中，我们输入：stop-dfs.sh

2.然后关闭zookeeper，利用Xshell全部会话栏输入命令，我们输入：zkServer.sh stop

注意：你下一次启动hdfs集群的时候还需要用hadoop-daemon.sh start journalnode命令启动journalnode吗？
不需要,只要start-dfs.sh就可以了。我们之前启动journalnode是为了同步两个namenode之间的信息。

3.首先到/opt/lychee/hadoop-2.6.5/etc/hadoop
目录下。利用Xshell全部会话栏输入命令：

 cd /opt/lychee/hadoop-2.6.5/etc/hadoop

然后，我们 ll 一下，会看到有一个mapred-site.xml.template文件。

在node01中操作
4.我们要给mapred-site.xml.template文件留一个备份，以防我们将它修改坏了，现在我们拷贝一下mapred-site.xml.template这个文件，拷贝出来的新文件命名为mapred-site.xml。然后我们在拷贝出的mapred-site.xml这个文件中配置信息。

用以下命令来实现：

cp mapred-site.xml.template mapred-site.xml

然后我们在ll一下，发现mapred-site.xml拷贝成功。

5.配置mapred-site.xml

在里面配置信息,然后保存并退出。


		
        
                mapreduce.framework.name
                yarn

6.配置yarn-site

在里面配置信息,然后保存并退出。下面配置里面虚拟机主机名请相应对照自己的虚拟机主机名。


        
        
                yarn.nodemanager.aux-services
                mapreduce_shuffle
        
        
                yarn.resourcemanager.ha.enabled
                true
        
        
                yarn.resourcemanager.cluster-id
                cluster1
        
        
                yarn.resourcemanager.ha.rm-ids
                rm1,rm2
        
        
                yarn.resourcemanager.hostname.rm1
                node03
        
        
                yarn.resourcemanager.hostname.rm2
                node04
        
        
                yarn.resourcemanager.zk-address
                node02:2181,node03:2181,node04:2181

7.在node01中把mapred-site.xml和yarn-site.xml 分发到node02、node03、node04三台虚拟机中。

scp mapred-site.xml yarn-site.xml node02:`pwd`
scp mapred-site.xml yarn-site.xml node03:`pwd`
scp mapred-site.xml yarn-site.xml node04:`pwd`

（二）、node03与node4相互免密

为什么它们要相互免密？
因为它们俩都是resourcemanager。resourcemanager是管理resource资源

在前面我们做过了node03,node04它们自身的免密

1.利用Xshell全部会话栏输入命令cd /root/.ssh。

2.把node03的公钥分发给node04。
在node03虚拟机上执行命令

scp id_dsa.pub node04:`pwd`/node03.pub

3.在node04虚拟机上执行命令

cat node03.pub >> authorized_keys

执行一下命令，看是否免密，最后不要忘记exit退出登录。
ssh node04
exit

4.把node04的公钥分发给node03。
在node04虚拟机上执行命令

scp id_dsa.pub node03:`pwd`/node04.pub

5.在node03虚拟机上执行命令

cat node04.pub >> authorized_keys

执行一下命令，看是否免密，最后不要忘记exit退出登录。
ssh node03
exit

这是我们最后所完成的免密关系图。

（三）、启动集群

1.利用Xshell全部会话栏输入命令zkServer.sh start。

2.在node01上启动dfs, start-dfs.sh

3.在node01上启动yarn, start-yarn.sh

4.在node03,node04上分别启动resourcemanager。

yarn-daemon.sh start resourcemanager

5.利用Xshell全部会话栏输入命令jps，查看进程全不全。

（四）、在windows环境看resourcemanager管理内容

在集群启动的情况下，我们在浏览器（不要用360浏览器，这里我用火狐）中搜索有 resourcemanager节点的虚拟机主机名：8088，这里我搜的是 node03:8088

单击active node，我们可以看到ndoe02,ndoe03,ndoe04活跃着。

十一、关闭集群

1.在node01上启动dfs, stop-dfs.sh

2.在node01上启动yarn, stop-yarn.sh

3.在node03,node04上分别启动resourcemanager。

yarn-daemon.sh stop resourcemanager

4.利用Xshell全部会话栏输入命令zkServer.sh stop。

5.利用Xshell全部会话栏输入命令jps，查看进程只剩下jps一个进程，则退出成功。

十二、wordcount实例

现在让我们来跑一个wordcount试试！！
这个实例我们在node01虚拟机上操作，并且把 集群开启。。

1.这里首先我们在Windows内准备一个有内容的.txt文件夹，这里我给它命名为500miles。

（1）利用Xshell和Xftp将它传输给虚拟机内你要存放的路径中，这里我存放在根目录root下。

（2）我们可以到存放的目录下，ll一下，会发现你存的500miles.txt。

2.在HDFS中创建输入目录和输出目录。

（1）创建输入目录命令（就是把我们要wordcount那个文件里的东西放入其中）

hdfs dfs -mkdir -p /data/in

（2）创建输出目录命令（就是把wordcount的结果放入其中）

hdfs dfs -mkdir -p /data/out

（3）在Windows环境下，用浏览器搜node01:50070。按照下图步骤来，如果出现in和out目录则证明创建成功。

3.将要统计数据的文件上传到输入目录并查看

（1）将要统计数据的文件上传到输入目录。
hdfs dfs -put 要统计数据的文件名 /data/in
例如：
hdfs dfs -put 500miles.txt /data/in

（2）在浏览器中刷新并查看500miles文件是否存在。

也可以在虚拟机用命令查看 hdfs dfs -ls /data/in

4.进入MapReduce目录（对大数据进行计算）

cd /opt/lychee/hadoop-2.6.5/share/hadoop/mapreduce

然后我们 ll一下，可以看到其中有一个样例jar包hadoop-mapreduce-examples-2.6.5.jar。

5.运行wordcount。此时的/data/out必须是空目录
输入命令：

hadoop jar hadoop-mapreduce-examples-2.6.5.jar wordcount /data/in /data/out/result

6.查看运行结果
（1）查看result目录下生成的文件。

hdfs dfs -ls /data/out/result

SUCCESS放的是成功与否的信息。

我们刷新一下浏览器，也可以查看是否成功。

（2）查看part-r-00000里面的信息。

-cat 查看文件的命令
ls 查看目录的命令

hdfs dfs -cat /data/out/result/part-r-00000

我们就可以看见每个单词出现的次数。

7.最后我们可以关闭集群了。

你可能感兴趣的:(Hadoop,hadoop)

HDFS相关的面试题努力的搬砖人. java 面试 hdfs
以下是150道HDFS相关的面试题，涵盖了HDFS的基本概念、架构、操作、数据存储、高可用性、权限管理、性能优化、容错机制、与MapReduce的结合、安全性、数据压缩、监控与管理、与YARN的关系、数据一致性、数据备份与恢复等方面，希望对你有所帮助。HDFS基本概念1.HDFS是什么？它的设计目标是什么？•HDFS是Hadoop分布式文件系统，设计目标是实现对大规模数据的高吞吐量访问，适用于一次
hadoop3.x--搭建hadoop高可用集群（HA模式）运维小菜 hadoop hadoop hdfs
hadoop高可用集群（HA模式）一、安装前1.集群规划2.安装前配置3.安装jdk与hadoop4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs集群三、MapReduce与Yarn1.配置MapReduce2.配置yarn3.启动yarn四、验证1.查看java进程2.hdfs与yarn前台页面一、安装前1.集群规划hostnameipNN
在虚拟机上安装Hadoop 杜清卿 hadoop
基本步骤与安装java一致:先用finalshell将hadoop-3.1.3.tar.gz导入到opt目录下面的software文件夹下面，然后解压,最后配置环境变量。1.使用finalshell上传。这里直接鼠标拖动操作即可。2.解压。进入到Hadoop安装包路径下，cd/opt/software/，再解压安装文件到/opt/module下，对应的命令是:tar-zxvfhadoop-.1.3
hadoop集群配置-scp拓展使用杜清卿 hadoop 服务器大数据
任务1：在hadoop102上，将hadoop101中/opt/module/hadoop-3.1.3目录拷贝到hadoop102上。分析：使用scp进行拉取操作：先登录到hadoop2使用命令：scp-rroot@hadoop101:/opt/module/hadoop-3.1.3/opt/module/任务2：在hadoop101上操作，将hadoop100中/opt/module目录下所有目
大数据学习（75）-大数据组件总结 viperrrrrrr 大数据 impala yarn hdfs hive CDH mapreduce
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH（ClouderaDistributionIncludingApacheHadoop)是由Cloudera公司提供的一个集成了ApacheHadoop以及相关生态系统的发行版本。CDH是一个大数据平台，简化和加速了大数据处理分析的部署和管理。CDH提供Hadoop的
Sqoop安装部署愿与狸花过一生大数据 sqoop hadoop hive
ApacheSqoop简介Sqoop（SQL-to-Hadoop）是Apache开源项目，主要用于：将关系型数据库中的数据导入Hadoop分布式文件系统（HDFS）或相关组件（如Hive、HBase）。将Hadoop处理后的数据导出回关系型数据库。核心特性批量数据传输支持从数据库表到HDFS/Hive的全量或增量数据迁移。并行化处理基于MapReduce实现并行导入导出，提升大数据量场景的效率。自
ssh命令满分对我强制爱 linux 服务器运维 spark
ssh命令无需密码也可登录要先关闭防火墙，命令如下：systemctlstopfirewalldsystemctldisablefirewalldsystemctlstatusfirewalldeg：目标：hadoop100通过ssh访问hadoop101,hadoop102时不需要密码，其他两台设备也类似。具体操作如下：1.在hadoop100中生成公钥和密码。ssh-keygen-trsa三次
Hive面试题御风行云天面试题大全 hive hadoop 数据仓库面试
Hive面试题1Hive基础概念1.1解释Hive是什么以及它的用途Hive的主要用途：1.2描述Hive架构和组件1.HiveCLI/Beeline和WebUI2.HiveQL3.HiveDriver（驱动）4.Metastore5.Compiler（编译器）6.Optimizer（优化器）7.Executor（执行器）8.HadoopCoreComponents（核心组件）9.HiveUDFs
#Hadoop全分布式安装 #mysql安装 #hive安装砸吧砸吧 hadoop hive yarn mysql
分布式（多台机器部署不同组件）与集群（多台机器部署相同组件）概念。Linux基础命令linux具有文件数：目录、文件，从根目录开始，路径具有唯一性。pwd：显示当前路径特殊符号：/：根目录.：隐藏文件，如果路径以.开始，表示当前目录下..：当前目录下的上一级~：当前目录的home目录--help：帮助命令使用linux常用操作命令tab键：自动补全ls：显示指定目录内容默认：当前路径-a：显示所有
Hadoop（在Linux中安装jdk）錠诗味 linux hadoop 运维
安装之前需准备：1.需要远程连接软件2.需要jdk3.需要准备两个文件夹01/export/software安装包02/export/servers解压文件夹现在正式开始安装1.将压缩包存放在/export/software目录下2.进入到software目录进行解压cd/export/software（切换目录）tar-zxvfjdk-8u202-linux-x64.tar.gz-C/expor
数据仓库和非结构化数据。 weixin_30631587 数据库
数据仓库包含标准化数据。还包含外部数据/非结构化数据如果外部数据量小可以保持数据库内部或者专用服务器。如果量大只能记住地址，在etl加载当然也有需求是实时数据比如股票汇率拿只能etl过程处理非结构化数据包含图片，视频音频如果是传统数据库db2oracle存在里面是不合适的。存储影响性能如果是hadoop无所谓影响不大，但是从使用者的角度非结构化数据只能转换关系使用建一张元数据表存储非结构化存储位置
CentOS 7系统中hadoop的安装和环境配置代码小张z centos hadoop linux
1.创建Hadoop安装解压路径：mkdir-p/usr/hadoop2.进入路径：cd/usr/hadoop3.下载安装包（我这里用的是阿里云镜像压缩包）：wgethttps://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz4.解压安装包到hadoop文件路径：tar-zxvf/usr/hadoo
尚硅谷电商数仓6.0，hive on spark,spark启动不了新时代赚钱战士 hive spark hadoop
在datagrip执行分区插入语句时报错[42000][40000]Errorwhilecompilingstatement:FAILED:SemanticExceptionFailedtogetasparksession:org.apache.hadoop.hive.ql.metadata.HiveException:FailedtocreateSparkclientforSparksessio
Hadoop相关面试题努力的搬砖人. java 面试 hadoop
以下是150道Hadoop面试题及其详细回答，涵盖了Hadoop的基础知识、HDFS、MapReduce、YARN、HBase、Hive、Sqoop、Flume、ZooKeeper等多个方面，每道题目都尽量详细且简单易懂：Hadoop基础概念类1.什么是Hadoop？Hadoop是一个由Apache基金会开发的开源分布式计算框架，主要用于处理和存储大规模数据集。它提供了高容错性和高扩展性的分布式存
Flink读取kafka数据并写入HDFS 王知无(import_bigdata) Flink系统性学习专栏 hdfs kafka flink
硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021年从零到大数据专家面试篇之消息队列篇2021年从零到大数据专家面试篇之Spark篇2021年从零到大数据专家面试篇之Hbase篇
Apache storm 赵世炎 storm hadoop
Apachestorm是一个分布式的实时大数据处理系统。用于在容错和水平可拓展方法中处理大量数据。它是一个流数据框架，具有很高的摄取率，无状态。通过zk管理分布式环境和集群状态，并行地对实时数据执行各种操作。storm易于设置和操作，并且它保证每个消息将通过拓扑至少处理一次。基本上Hadoop和Storm框架用于分析大数据。两者互补，在某些方面有所不同。ApacheStorm执行除持久性之外的所有
什么是Apache Avro？ maozexijr apache
什么是ApacheAvro？ApacheAvro是一个开源的数据序列化框架，主要用于高效的数据交换和存储。它由ApacheHadoop项目开发，广泛应用于大数据生态系统中（如Hadoop、Kafka等）。Avro提供了一种紧凑、快速的二进制数据格式，同时支持丰富的数据结构和模式演化。核心特性跨语言支持Avro支持多种编程语言（如Java、Python、C++、Go等），使得不同语言之间的数据交换变
计算机毕业设计之基于Hadoop的热点新闻分析系统的设计与实现微信bishe69 课程设计 python django mysql
近些年来，随着科技的飞速发展，互联网的普及逐渐延伸到各行各业中，给人们生活带来了十分的便利，热点新闻分析系统利用计算机网络实现信息化管理，使整个热点新闻分析的发展和服务水平有显著提升。本文拟采用PyCharm开发工具，django框架、Python语言、Hadoop大数据处理技术进行开发，后台使用MySQL数据库进行信息管理，设计开发的热点新闻分析系统。通过调研和分析，系统拥有管理员和用户两个模块
Hadoop 实战笔记（二）-- HDFS 常用 shell 命令总结 dazhong2012 Hadoop hdfs hadoop
一、HDFS命令显示当前目录结构#显示当前目录结构hadoopfs-ls#递归显示当前目录结构hadoopfs-ls-R#显示根目录下内容hadoopfs-ls/创建目录#创建目录hadoopfs-mkdir#递归创建目录hadoopfs-mkdir-p删除操作#删除文件hadoopfs-rm#递归删除目录和文件hadoopfs-rm-R从本地加载文件到HDFS#二选一执行即可hadoopfs-p
How Spark Read Sftp Files from Hadoop SFTP FileSystem IT•轩辕 Cloudy Computation spark hadoop 大数据
GradleDependenciesimplementation('org.apache.spark:spark-sql_2.13:3.5.3'){excludegroup:"org.apache.logging.log4j",module:"log4j-slf4j2-impl"}implementation('org.apache.hadoop:hadoop-common:3.3.4'){exc
中电金信25/3/18面前笔试（需求分析岗+数据开发岗）苍曦需求分析前端 javascript
部分相同题目在第二次数据开发岗中不做解析，本次解析来源于豆包AI，正确与否有待商榷，本文只提供一个速查与知识点的补充。一、需求分析第1题，单选题,Hadoop的核心组件包括HDFS和以下哪个？MapReduceSparkStormFlink解析：Hadoop的核心组件是HDFS（分布式文件系统）和MapReduce（分布式计算框架）。Spark、Storm、Flink虽然也是大数据处理相关技术，但
Spark集群启动与关闭陈沐 spark spark hadoop big data
Hadoop集群和Spark的启动与关闭Hadoop集群开启三台虚拟机均启动ZookeeperzkServer.shstartMaster1上面执行启动HDFSstart-dfs.shslave1上面执行开启YARNstart-yarn.shslave2上面执行开启YARN的资源管理器yarn-daemon.shstartresourcemanager(如果nodeManager没有启动(正常情况
Hive函数大全：从核心内置函数到自定义UDF实战指南（附详细案例与总结）一个天蝎座白勺程序猿大数据开发从入门到实战合集 hive hadoop 数据仓库
目录背景‌一、Hive函数分类与核心函数表‌1.内置函数分类‌2.用户自定义函数（UDF）分类二、常用函数详解与实战案例‌1.数学函数‌2.字符串函数‌3.窗口函数‌4.自定义UDF实战‌三、总结与优化建议‌1.核心总结2.性能优化建议‌3.常问问题背景‌Hive作为Hadoop生态中最常用的数据仓库工具，其强大的函数库是高效处理和分析海量数据的核心能力之一。Hive函数分为‌内置函数‌和‌用户自
Hadoop MapReduce 词频统计（WordCount）代码解析教程我不是少爷. Java基础 hadoop mapreduce 大数据
一、概述这是一个基于HadoopMapReduce框架实现的经典词频统计程序。程序会统计输入文本中每个单词出现的次数，并将结果输出到HDFS文件系统。二、代码结构packagecom.bigdata.wc;//Hadoop核心类库导入importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;//数据类型定义
从“笨重大象”到“敏捷火花”：Hadoop与Spark的大数据技术进化之路 Echo_Wish 大数据大数据 hadoop spark
从“笨重大象”到“敏捷火花”：Hadoop与Spark的大数据技术进化之路说起大数据技术，Hadoop和Spark可以说是这个领域的两座里程碑。Hadoop曾是大数据的开山之作，而Spark则带领我们迈入了一个高效、灵活的大数据处理新时代。那么，它们的演变过程到底有何深意？背后技术上的取舍和选择，又意味着什么？一、Hadoop：分布式存储与计算的奠基者Hadoop诞生于互联网流量爆发式增长的时代，
hadoop集群关闭命令顺序_启动和关闭Hadoop集群命令步骤氪老师 hadoop集群关闭命令顺序
启动和关闭Hadoop集群命令步骤总结：1.在master上启动hadoop-daemon.shstartnamenode.2.在slave上启动hadoop-daemon.shstartdatanode.3.用jps指令观察执行结果.4.用hdfsdfsadmin-report观察集群配置情况.5.通过http://npfdev1:50070界面观察集群运行情况.(如果遇到问题看https://
在kali linux中配置hadoop伪分布式 we19a0sen 三数据分析分布式 linux hadoop
目录一.配置静态网络二.配置主机名与IP地址映射三.配置SSH免密登录四.配置Java和Hadoop环境五.配置Hadoop伪分布式六.启动与验证一.配置静态网络原因：Hadoop集群依赖稳定的网络通信，动态IP可能导致节点失联。静态IP确保节点始终通过固定地址通信。操作步骤：#修改网络配置文件sudovim/etc/network/interfaces#添加内容（根据实际网络修改）：autoet
Spark任务读取hive表数据导入es 小小小小小小小小小小码农 hive elasticsearch spark java
使用elasticsearch-hadoop将hive表数据导入es，超级简单1.引入pomorg.elasticsearchelasticsearch-hadoop9.0.0-SNAPSHOT2.创建sparkconf//spark参数设置SparkConfsparkConf=newSparkConf();//要写入的索引sparkConf.set("es.resource","");//es集
hive-进阶版-1 数据牧马人 hive hadoop 数据仓库
第6章hive内部表与外部表的区别Hive是一个基于Hadoop的数据仓库工具，用于对大规模数据集进行数据存储、查询和分析。Hive支持内部表（ManagedTable）和外部表（ExternalTable）两种表类型，它们在数据存储、管理方式和生命周期等方面存在显著区别。以下是内部表和外部表的主要区别：1.数据存储位置内部表：数据存储在Hive的默认存储目录下，通常位于HDFS（HadoopDi
大数据手册(Spark)--Spark安装配置 WilenWu 数据分析(Data Analysis)大数据 spark 分布式
本文默认在zsh终端安装配置，若使用bash终端，环境变量的配置文件相应变化。若安装包下载缓慢，可复制链接到迅雷下载，亲测极速～准备工作Spark的安装过程较为简单，在已安装好Hadoop的前提下，经过简单配置即可使用。假设已经安装好了hadoop（伪分布式）和hive，环境变量如下JAVA_HOME=/usr/opt/jdkHADOOP_HOME=/usr/local/hadoopHIVE_HO
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&