zh_250

史上最详细的Hadoop环境搭建

GitChat 作者：鸣宇淳
原文：史上最详细的Hadoop环境搭建
关注公众号：GitChat 技术杂谈，一本正经的讲技术
【不要错过文末活动哦】

前言

Hadoop在大数据技术体系中的地位至关重要，Hadoop是大数据技术的基础，对Hadoop基础知识的掌握的扎实程度，会决定在大数据技术道路上走多远。

这是一篇入门文章，Hadoop的学习方法很多，网上也有很多学习路线图。本文的思路是：以安装部署Apache Hadoop2.x版本为主线，来介绍Hadoop2.x的架构组成、各模块协同工作原理、技术细节。安装不是目的，通过安装认识Hadoop才是目的。

本文分为五个部分、十三节、四十九步。

第一部分：Linux环境安装

Hadoop是运行在Linux，虽然借助工具也可以运行在Windows上，但是建议还是运行在Linux系统上，第一部分介绍Linux环境的安装、配置、Java JDK安装等。

第二部分：Hadoop本地模式安装

Hadoop本地模式只是用于本地开发调试，或者快速安装体验Hadoop，这部分做简单的介绍。

第三部分：Hadoop伪分布式模式安装

学习Hadoop一般是在伪分布式模式下进行。这种模式是在一台机器上各个进程上运行Hadoop的各个模块，伪分布式的意思是虽然各个模块是在各个进程上分开运行的，但是只是运行在一个操作系统上的，并不是真正的分布式。

第四部分：完全分布式安装

完全分布式模式才是生产环境采用的模式，Hadoop运行在服务器集群上，生产环境一般都会做HA，以实现高可用。

第五部分：Hadoop HA安装

HA是指高可用，为了解决Hadoop单点故障问题，生产环境一般都做HA部署。这部分介绍了如何配置Hadoop2.x的高可用，并简单介绍了HA的工作原理。
安装过程中，会穿插简单介绍涉及到的知识。希望能对大家有所帮助。

第一部分：Linux环境安装

第一步、配置Vmware NAT网络

一、Vmware网络模式介绍

参考：http://blog.csdn.net/collection4u/article/details/14127671

二、NAT模式配置

NAT是网络地址转换，是在宿主机和虚拟机之间增加一个地址转换服务，负责外部和虚拟机之间的通讯转接和IP转换。

我们部署Hadoop集群，这里选择NAT模式，各个虚拟机通过NAT使用宿主机的IP来访问外网。

我们的要求是集群中的各个虚拟机有固定的IP、可以访问外网，所以进行如下设置：

1、 Vmware安装后，默认的NAT设置如下：

2、默认的设置是启动DHCP服务的，NAT会自动给虚拟机分配IP，但是我们需要将各个机器的IP固定下来，所以要取消这个默认设置。

3、为机器设置一个子网网段，默认是192.168.136网段，我们这里设置为100网段，将来各个虚拟机Ip就为 192.168.100.*。

4、点击NAT设置按钮，打开对话框，可以修改网关地址和DNS地址。这里我们为NAT指定DNS地址。

5、网关地址为当前网段里的.2地址，好像是固定的，我们不做修改，先记住网关地址就好了，后面会用到。

第二步、安装Linux操作系统

三、Vmware上安装Linux系统

1、文件菜单选择新建虚拟机

2、选择经典类型安装，下一步。

3、选择稍后安装操作系统，下一步。

4、选择Linux系统，版本选择CentOS 64位。

5、命名虚拟机，给虚拟机起个名字，将来显示在Vmware左侧。并选择Linux系统保存在宿主机的哪个目录下，应该一个虚拟机保存在一个目录下，不能多个虚拟机使用一个目录。

6、指定磁盘容量，是指定分给Linux虚拟机多大的硬盘，默认20G就可以，下一步。

7、点击自定义硬件，可以查看、修改虚拟机的硬件配置，这里我们不做修改。

8、点击完成后，就创建了一个虚拟机，但是此时的虚拟机还是一个空壳，没有操作系统，接下来安装操作系统。

9、点击编辑虚拟机设置，找到DVD，指定操作系统ISO文件所在位置。

10、点击开启此虚拟机，选择第一个回车开始安装操作系统。

11、设置root密码。

12、选择Desktop，这样就会装一个Xwindow。

13、先不添加普通用户，其他用默认的，就把Linux安装完毕了。

四、设置网络

因为Vmware的NAT设置中关闭了DHCP自动分配IP功能，所以Linux还没有IP，需要我们设置网络各个参数。

1、用root进入Xwindow，右击右上角的网络连接图标，选择修改连接。

2、网络连接里列出了当前Linux里所有的网卡，这里只有一个网卡System eth0，点击编辑。

3、配置IP、子网掩码、网关（和NAT设置的一样）、DNS等参数，因为NAT里设置网段为100.*，所以这台机器可以设置为192.168.100.10网关和NAT一致，为192.168.100.2

4、用ping来检查是否可以连接外网，如下图，已经连接成功。

五、修改Hostname

1、临时修改hostname

[root@localhost Desktop]# hostname bigdata-senior01.chybinmy.com
     
     
     
     
      
      
      
      1

这种修改方式，系统重启后就会失效。

2、永久修改hostname

想永久修改，应该修改配置文件 /etc/sysconfig/network。

命令：[root@bigdata-senior01 ~] vim /etc/sysconfig/network
     
     
     
     
      
      
      
      1

打开文件后，


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         NETWORKING=yes  #使用网络
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         HOSTNAME=bigdata-senior01.chybinmy.com  #设置主机名
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

六、配置Host


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         命令：[root
         
         
         
         @bigdata-senior01 ~] vim /etc/hosts
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         添加hosts: 
         
         
         
         192.168
         
         
         
         .100
         
         
         
         .10 bigdata-senior01.chybinmy.com
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

七、关闭防火墙

学习环境可以直接把防火墙关闭掉。

(1) 用root用户登录后，执行查看防火墙状态。

[root@bigdata-senior01 hadoop]# service iptables status
     
     
     
     
      
      
      
      1

(2) 用[root@bigdata-senior01 hadoop]# service iptables stop关闭防火墙，这个是临时关闭防火墙。


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [root
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]# service iptables stop
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         iptables: Setting chains to policy ACCEPT: filter          [  OK  ]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         iptables: Flushing firewall rules:                         [  OK  ]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         iptables: Unloading modules:                               [  OK  ]
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4

(3) 如果要永久关闭防火墙用。

[root@bigdata-senior01 hadoop]# chkconfig iptables off
     
     
     
     
      
      
      
      1

关闭，这种需要重启才能生效。

八、关闭selinux

selinux是Linux一个子安全机制，学习环境可以将它禁用。

[hadoop@bigdata-senior01 hadoop-2.5.0]$ vim /etc/sysconfig/selinux
     
     
     
     
      
      
      
      1


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         # This file controls the state of SELinux on the system.
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         # SELINUX= can take one of these three values:
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #     enforcing - SELinux security policy is enforced.
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #     permissive - SELinux prints warnings instead of enforcing.
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #     disabled - No SELinux policy is loaded.
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         SELINUX=disabled
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         # SELINUXTYPE= can take one of these two values:
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #     targeted - Targeted processes are 
         
         
         
         protected,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #     mls - Multi Level Security protection.
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         SELINUXTYPE=targeted
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8
      
      
      
      9
      
      
      
      10

第三步、安装JDK

九、安装Java JDK

1、查看是否已经安装了java JDK。

[root@bigdata-senior01 Desktop]# java –version
     
     
     
     
      
      
      
      1

注意：Hadoop机器上的JDK，最好是Oracle的Java JDK，不然会有一些问题，比如可能没有JPS命令。
如果安装了其他版本的JDK，卸载掉。

2、安装java JDK

(1) 去下载Oracle版本Java JDK：jdk-7u67-linux-x64.tar.gz

(2) 将jdk-7u67-linux-x64.tar.gz解压到/opt/modules目录下

[root@bigdata-senior01 /]# tar -zxvf jdk-7u67-linux-x64.tar.gz -C /opt/modules
     
     
     
     
      
      
      
      1

(3) 添加环境变量

设置JDK的环境变量 JAVA_HOME。需要修改配置文件/etc/profile，追加


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         export JAVA_HOME=
         
         
         
         "/opt/modules/jdk1.7.0_67"
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         export PATH=$JAVA_HOME/bin:$PATH
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

修改完毕后，执行 source /etc/profile

(4)安装后再次执行 java –version,可以看见已经安装完成。


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [root
         
         
         
         @bigdata-senior01 /]# java -version
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         java version 
         
         
         
         "1.7.0_67"
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Java(TM) 
         
         
         
         SE Runtime Environment (build 
         
         
         
         1.7
         
         
         
         .0
         
         
         
         _67-b01)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Java 
         
         
         
         HotSpot
         
         
         
         (TM) 
         
         
         
         64
         
         
         
         -Bit Server VM (build 
         
         
         
         24.65
         
         
         
         -b04, mixed mode)
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4

第二部分：Hadoop本地模式安装

第四步、Hadoop部署模式

Hadoop部署模式有：本地模式、伪分布模式、完全分布式模式、HA完全分布式模式。

区分的依据是NameNode、DataNode、ResourceManager、NodeManager等模块运行在几个JVM进程、几个机器。

模式名称	各个模块占用的JVM进程数	各个模块运行在几个机器数上
本地模式	1个	1个
伪分布式模式	N个	1个
完全分布式模式	N个	N个
HA完全分布式	N个	N个

第五步、本地模式部署

十、本地模式介绍

本地模式是最简单的模式，所有模块都运行与一个JVM进程中，使用的本地文件系统，而不是HDFS，本地模式主要是用于本地开发过程中的运行调试用。下载hadoop安装包后不用任何设置，默认的就是本地模式。

十一、解压hadoop后就是直接可以使用

1、创建一个存放本地模式hadoop的目录

[hadoop@bigdata-senior01 modules]$ mkdir /opt/modules/hadoopstandalone
     
     
     
     
      
      
      
      1

2、解压hadoop文件

[hadoop@bigdata-senior01 modules]$ tar -zxf /opt/sofeware/hadoop-2.5.0.tar.gz  -C /opt/modules/hadoopstandalone/
     
     
     
     
      
      
      
      1

3、确保JAVA_HOME环境变量已经配置好


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 modules]$ echo ${JAVA_HOME}
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         /opt/modules/jdk1
         
         
         
         .7
         
         
         
         .0_67
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

十二、运行MapReduce程序，验证

我们这里用hadoop自带的wordcount例子来在本地模式下测试跑mapreduce。

1、准备mapreduce输入文件wc.input


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 modules]$ cat /opt/data/wc.input
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         hadoop mapreduce hive
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         hbase spark storm
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         sqoop hadoop hive
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         spark hadoop
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5

2、运行hadoop自带的mapreduce Demo

[hadoop@bigdata-senior01 hadoopstandalone]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount /opt/data/wc.input output2
     
     
     
     
      
      
      
      1

这里可以看到job ID中有local字样，说明是运行在本地模式下的。

3、查看输出文件

本地模式下，mapreduce的输出是输出到本地。


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoopstandalone]$ ll output2
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         total 
         
         
         
         4
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         -rw-r--r-- 
         
         
         
         1 hadoop hadoop 
         
         
         
         60 Jul  
         
         
         
         7 
         
         
         
         12:
         
         
         
         50 part-r-
         
         
         
         00000
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         -rw-r--r-- 
         
         
         
         1 hadoop hadoop  
         
         
         
         0 Jul  
         
         
         
         7 
         
         
         
         12:
         
         
         
         50 _SUCCESS
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4

输出目录中有_SUCCESS文件说明JOB运行成功，part-r-00000是输出结果文件。

第三部分：Hadoop伪分布式模式安装

第六步、伪分布式Hadoop部署过程

十三、Hadoop所用的用户设置

1、创建一个名字为hadoop的普通用户


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [root
         
         
         
         @bigdata-senior01 ~]# useradd hadoop
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [root
         
         
         
         @bigdata-senior01 ~]# passwd hadoop
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

2、给hadoop用户sudo权限

[root@bigdata-senior01 ~]# vim /etc/sudoers
     
     
     
     
      
      
      
      1

设置权限，学习环境可以将hadoop用户的权限设置的大一些，但是生产环境一定要注意普通用户的权限限制。


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         root    ALL=(ALL)       ALL
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         hadoop ALL=(root) NOPASSWD:ALL
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

注意：如果root用户无权修改sudoers文件，先手动为root用户添加写权限。

[root@bigdata-senior01 ~]# chmod u+w /etc/sudoers
     
     
     
     
      
      
      
      1

3、切换到hadoop用户


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [root
         
         
         
         @bigdata-senior01 ~]# su - hadoop
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 ~]$
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

4、创建存放hadoop文件的目录

[hadoop@bigdata-senior01 ~]$ sudo mkdir /opt/modules
     
     
     
     
      
      
      
      1

5、将hadoop文件夹的所有者指定为hadoop用户

如果存放hadoop的目录的所有者不是hadoop，之后hadoop运行中可能会有权限问题，那么就讲所有者改为hadoop。

[hadoop@bigdata-senior01 ~]# sudo chown -R hadoop:hadoop /opt/modules
     
     
     
     
      
      
      
      1

十四、解压Hadoop目录文件

1、复制hadoop-2.5.0.tar.gz到/opt/modules目录下。

2、解压hadoop-2.5.0.tar.gz


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 ~]# cd /opt/modules
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop]# tar -zxvf hadoop-
         
         
         
         2.5
         
         
         
         .0.tar.gz
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

十五、配置Hadoop

1、配置Hadoop环境变量

[hadoop@bigdata-senior01 hadoop]# vim /etc/profile
     
     
     
     
      
      
      
      1

追加配置：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         export HADOOP_HOME=
         
         
         
         "/opt/modules/hadoop-2.5.0"
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

执行：source /etc/profile 使得配置生效

验证HADOOP_HOME参数：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 /]$ echo $HADOOP_HOME
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         /opt/modules/hadoop-
         
         
         
         2.5
         
         
         
         .0
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

2、配置 hadoop-env.sh、mapred-env.sh、yarn-env.sh文件的JAVA_HOME参数

[hadoop@bigdata-senior01 ~]$ sudo vim  ${HADOOP_HOME}/etc/hadoop/hadoop-env.sh
     
     
     
     
      
      
      
      1


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         修改JAVA_HOME参数为：
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         export JAVA_HOME=
         
         
         
         "/opt/modules/jdk1.7.0_67"
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

3、配置core-site.xml

[hadoop@bigdata-senior01 ~]{HADOOP_HOME}/etc/hadoop/core-site.xml

（1） fs.defaultFS参数配置的是HDFS的地址。


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <name>fs.defaultFS
         
         
         
         name>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <value>hdfs://bigdata-senior01.chybinmy.com:8020
         
         
         
         value>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         property>
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4

（2） hadoop.tmp.dir配置的是Hadoop临时目录，比如HDFS的NameNode数据默认都存放这个目录下，查看*-default.xml等默认配置文件，就可以看到很多依赖${hadoop.tmp.dir}的配置。

默认的hadoop.tmp.dir是/tmp/hadoop-${user.name},此时有个问题就是NameNode会将HDFS的元数据存储在这个/tmp目录下，如果操作系统重启了，系统会清空/tmp目录下的东西，导致NameNode元数据丢失，是个非常严重的问题，所有我们应该修改这个路径。

    [hadoop@bigdata-senior01 hadoop-2.5.0]$ sudo mkdir -p /opt/data/tmp
     
     
     
     
      
      
      
      1

[hadoop@bigdata-senior01 hadoop-2.5.0]$ sudo chown –R hadoop:hadoop /opt/data/tmp
     
     
     
     
      
      
      
      1

修改hadoop.tmp.dir


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
         
         
         
         <property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
           
         
         
         
         <name>hadoop.tmp.dir
         
         
         
         name>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         <value>/opt/data/tmp
         
         
         
         value>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
          
         
         
         
         property>
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4

十六、配置、格式化、启动HDFS

1、配置hdfs-site.xml

[hadoop@bigdata-senior01 hadoop-2.5.0]$ vim ${HADOOP_HOME}/etc/hadoop/hdfs-site.xml
     
     
     
     
      
      
      
      1


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         <property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
               
         
         
         
         <name>dfs.replication
         
         
         
         name>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
               
         
         
         
         <value>1
         
         
         
         value>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         property>
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4

dfs.replication配置的是HDFS存储时的备份数量，因为这里是伪分布式环境只有一个节点，所以这里设置为1。

2、格式化HDFS

[hadoop@bigdata-senior01 ~]$ hdfs namenode –format
     
     
     
     
      
      
      
      1

格式化是对HDFS这个分布式文件系统中的DataNode进行分块，统计所有分块后的初始元数据的存储在NameNode中。

格式化后，查看core-site.xml里hadoop.tmp.dir（本例是/opt/data目录）指定的目录下是否有了dfs目录，如果有，说明格式化成功。

注意：

格式化时，这里注意hadoop.tmp.dir目录的权限问题，应该hadoop普通用户有读写权限才行，可以将/opt/data的所有者改为hadoop。
[hadoop@bigdata-senior01 hadoop-2.5.0]$ sudo chown -R hadoop:hadoop /opt/data
查看NameNode格式化后的目录。

   [hadoop@bigdata-senior01 ~]$ ll /opt/data/tmp/dfs/name/current
     
     
     
     
      
      
      
      1

fsimage是NameNode元数据在内存满了后，持久化保存到的文件。

fsimage*.md5 是校验文件，用于校验fsimage的完整性。

seen_txid 是hadoop的版本

vession文件里保存：

namespaceID：NameNode的唯一ID。
clusterID:集群ID，NameNode和DataNode的集群ID应该一致，表明是一个集群。


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #Mon Jul 
         
         
         
         04 
         
         
         
         17:
         
         
         
         25:
         
         
         
         50 CST 
         
         
         
         2016
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         namespaceID=
         
         
         
         2101579007
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         clusterID=CID-
         
         
         
         205277e6-
         
         
         
         493b-
         
         
         
         4601-
         
         
         
         8e33-c09d1d23ece4
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         cTime=
         
         
         
         0
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         storageType=NAME_NODE
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         blockpoolID=BP-
         
         
         
         1641019026-
         
         
         
         127.0
         
         
         
         .0
         
         
         
         .1-
         
         
         
         1467624350057
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         layoutVersion=-
         
         
         
         57
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7

3、启动NameNode


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ ${HADOOP_HOME}/sbin/hadoop-daemon.sh start namenode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         starting namenode, logging to /opt/modules/hadoop-
         
         
         
         2.5
         
         
         
         .0/logs/hadoop-hadoop-namenode-bigdata-senior01.chybinmy.com.out
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

4、启动DataNode


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ ${HADOOP_HOME}/sbin/hadoop-daemon.sh start datanode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         starting datanode, logging to /opt/modules/hadoop-
         
         
         
         2.5
         
         
         
         .0/logs/hadoop-hadoop-datanode-bigdata-senior01.chybinmy.com.out
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

5、启动SecondaryNameNode


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ ${HADOOP_HOME}/sbin/hadoop-daemon.sh start secondarynamenode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         starting secondarynamenode, logging to /opt/modules/hadoop-
         
         
         
         2.5
         
         
         
         .0/logs/hadoop-hadoop-secondarynamenode-bigdata-senior01.chybinmy.com.out
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

6、 JPS命令查看是否已经启动成功，有结果就是启动成功了。


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ jps
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         3034 NameNode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         3233 Jps
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         3193 SecondaryNameNode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         3110 DataNode
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5

7、 HDFS上测试创建目录、上传、下载文件

HDFS上创建目录

[hadoop@bigdata-senior01 hadoop-2.5.0]$ ${HADOOP_HOME}/bin/hdfs dfs -mkdir /demo1
     
     
     
     
      
      
      
      1

上传本地文件到HDFS上


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ ${HADOOP_HOME}/bin/hdfs dfs -put 
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         ${HADOOP_HOME}/etc/hadoop/core-site.xml /demo1
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

读取HDFS上的文件内容

[hadoop@bigdata-senior01 hadoop-2.5.0]$ ${HADOOP_HOME}/bin/hdfs dfs -cat /demo1/core-site.xml
     
     
     
     
      
      
      
      1

从HDFS上下载文件到本地

[hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs dfs -get /demo1/core-site.xml
     
     
     
     
      
      
      
      1

十七、配置、启动YARN

1、配置mapred-site.xml

默认没有mapred-site.xml文件，但是有个mapred-site.xml.template配置模板文件。复制模板生成mapred-site.xml。

[hadoop@bigdata-senior01 hadoop-2.5.0]# cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml
     
     
     
     
      
      
      
      1

添加配置如下：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <name>mapreduce.framework.name
         
         
         
         name>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <value>yarn
         
         
         
         value>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         property>
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4

指定mapreduce运行在yarn框架上。

2、配置yarn-site.xml

添加配置如下：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
          
         
         
         
         <name>yarn.nodemanager.aux-services
         
         
         
         name>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
          
         
         
         
         <value>mapreduce_shuffle
         
         
         
         value>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         <name>yarn.resourcemanager.hostname
         
         
         
         name>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         <value>bigdata-senior01.chybinmy.com
         
         
         
         value>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
         
         
         
         property>
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8

yarn.nodemanager.aux-services配置了yarn的默认混洗方式，选择为mapreduce的默认混洗算法。
yarn.resourcemanager.hostname指定了Resourcemanager运行在哪个节点上。

3、启动Resourcemanager

[hadoop@bigdata-senior01 hadoop-2.5.0]$ ${HADOOP_HOME}/sbin/yarn-daemon.sh start resourcemanager
     
     
     
     
      
      
      
      1

4、启动nodemanager

[hadoop@bigdata-senior01 hadoop-2.5.0]$ ${HADOOP_HOME}/sbin/yarn-daemon.sh start nodemanager
     
     
     
     
      
      
      
      1

5、查看是否启动成功


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ jps
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         3034 NameNode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         4439 NodeManager
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         4197 ResourceManager
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         4543 Jps
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         3193 SecondaryNameNode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         3110 DataNode
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7

可以看到ResourceManager、NodeManager已经启动成功了。

6、 YARN的Web页面

YARN的Web客户端端口号是8088，通过http://192.168.100.10:8088/可以查看。

十八、运行MapReduce Job

在Hadoop的share目录里，自带了一些jar包，里面带有一些mapreduce实例小例子，位置在share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar，可以运行这些例子体验刚搭建好的Hadoop平台，我们这里来运行最经典的WordCount实例。

1、创建测试用的Input文件

创建输入目录:

[hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs dfs -mkdir -p /wordcountdemo/input
     
     
     
     
      
      
      
      1

创建原始文件:

在本地/opt/data目录创建一个文件wc.input,内容如下。

将wc.input文件上传到HDFS的/wordcountdemo/input目录中:

[hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs dfs -put /opt/data/wc.input /wordcountdemo/input
     
     
     
     
      
      
      
      1

2、运行WordCount MapReduce Job


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         2.5
         
         
         
         .0.jar wordcount /wordcountdemo/input /wordcountdemo/output
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

3、查看输出结果目录


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ bin/hdfs dfs -ls /wordcountdemo/output
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         -rw-r--r--   
         
         
         
         1 hadoop supergroup          
         
         
         
         0 
         
         
         
         2016-
         
         
         
         07-
         
         
         
         05 
         
         
         
         05:
         
         
         
         12 /wordcountdemo/output/_SUCCESS
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         -rw-r--r--   
         
         
         
         1 hadoop supergroup         
         
         
         
         60 
         
         
         
         2016-
         
         
         
         07-
         
         
         
         05 
         
         
         
         05:
         
         
         
         12 /wordcountdemo/output/part-r-
         
         
         
         00000
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3

output目录中有两个文件，_SUCCESS文件是空文件，有这个文件说明Job执行成功。
part-r-00000文件是结果文件，其中-r-说明这个文件是Reduce阶段产生的结果，mapreduce程序执行时，可以没有reduce阶段，但是肯定会有map阶段，如果没有reduce阶段这个地方有是-m-。
一个reduce会产生一个part-r-开头的文件。
查看输出文件内容。


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ bin/hdfs dfs -cat /wordcountdemo/output/part-r-
         
         
         
         00000
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         hadoop  
         
         
         
         3
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         hbase   
         
         
         
         1
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         hive    
         
         
         
         2
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         mapreduce       
         
         
         
         1
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         spark   
         
         
         
         2
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         sqoop   
         
         
         
         1
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         storm   
         
         
         
         1
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8

结果是按照键值排好序的。

十九、停止Hadoop


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
          [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ sbin/hadoop-daemon.sh stop namenode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         stopping namenode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ sbin/hadoop-daemon.sh stop datanode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         stopping datanode
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ sbin/yarn-daemon.sh stop resourcemanager
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         stopping resourcemanager
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ sbin/yarn-daemon.sh stop nodemanager
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         stopping nodemanager
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8

二十、 Hadoop各个功能模块的理解

1、 HDFS模块

HDFS负责大数据的存储，通过将大文件分块后进行分布式存储方式，突破了服务器硬盘大小的限制，解决了单台机器无法存储大文件的问题，HDFS是个相对独立的模块，可以为YARN提供服务，也可以为HBase等其他模块提供服务。

2、 YARN模块

YARN是一个通用的资源协同和任务调度框架，是为了解决Hadoop1.x中MapReduce里NameNode负载太大和其他问题而创建的一个框架。

YARN是个通用框架，不止可以运行MapReduce，还可以运行Spark、Storm等其他计算框架。

3、 MapReduce模块

MapReduce是一个计算框架，它给出了一种数据处理的方式，即通过Map阶段、Reduce阶段来分布式地流式处理数据。它只适用于大数据的离线处理，对实时性要求很高的应用不适用。

第七步、开启历史服务

二十一、历史服务介绍

Hadoop开启历史服务可以在web页面上查看Yarn上执行job情况的详细信息。可以通过历史服务器查看已经运行完的Mapreduce作业记录，比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。

二十二、开启历史服务

[hadoop@bigdata-senior01 hadoop-2.5.0]$ sbin/mr-jobhistory-daemon.sh start historyserver、
     
     
     
     
      
      
      
      1

开启后，可以通过Web页面查看历史服务器：

http://bigdata-senior01.chybinmy.com:19888/

二十三、Web查看job执行历史

1、运行一个mapreduce任务


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         2.5
         
         
         
         .0.jar wordcount /wordcountdemo/input /wordcountdemo/output1
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

2、 job执行中

3、查看job历史

历史服务器的Web端口默认是19888，可以查看Web界面。

但是在上面所显示的某一个Job任务页面的最下面，Map和Reduce个数的链接上，点击进入Map的详细信息页面，再查看某一个Map或者Reduce的详细日志是看不到的，是因为没有开启日志聚集服务。

二十四、开启日志聚集

4、日志聚集介绍

MapReduce是在各个机器上运行的，在运行过程中产生的日志存在于各个机器上，为了能够统一查看各个机器的运行日志，将日志集中存放在HDFS上，这个过程就是日志聚集。

5、开启日志聚集

配置日志聚集功能：

Hadoop默认是不启用日志聚集的。在yarn-site.xml文件里配置启用日志聚集。


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         <name>yarn.log-aggregation-enable
         
         
         
         name>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         <value>true
         
         
         
         value>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
         
         
         
         property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         <property>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         <name>yarn.log-aggregation.retain-seconds
         
         
         
         name>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         <value>106800
         
         
         
         value>
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
         
         
         
         property>
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6
      
      
      
      7
      
      
      
      8

yarn.log-aggregation-enable:是否启用日志聚集功能。

yarn.log-aggregation.retain-seconds：设置日志保留时间，单位是秒。

将配置文件分发到其他节点：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop]$ scp /opt/modules/hadoop-
         
         
         
         2.5
         
         
         
         .0/etc/hadoop/yarn-site.xml bigdata-senior02.chybinmy.com:/opt/modules/hadoop-
         
         
         
         2.5
         
         
         
         .0/etc/hadoop/
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop]$ scp /opt/modules/hadoop-
         
         
         
         2.5
         
         
         
         .0/etc/hadoop/yarn-site.xml bigdata-senior03.chybinmy.com:/opt/modules/hadoop-
         
         
         
         2.5
         
         
         
         .0/etc/hadoop/
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

重启Yarn进程：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ sbin/stop-yarn.sh
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ sbin/start-yarn.sh
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

重启HistoryServer进程：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ sbin/mr-jobhistory-daemon.sh stop historyserver
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop
         
         
         
         @bigdata-senior01 hadoop-
         
         
         
         2.5
         
         
         
         .0]$ sbin/mr-jobhistory-daemon.sh start historyserver
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2

6、测试日志聚集

运行一个demo MapReduce，使之产生日志：

bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount /input /output1
     
     
     
     
      
      
      
      1

查看日志：

运行Job后，就可以在历史服务器Web页面查看各个Map和Reduce的日志了。

第四部分：完全分布式安装

第八步、完全布式环境部署Hadoop

完全分部式是真正利用多台Linux主机来进行部署Hadoop，对Linux机器集群进行规划，使得Hadoop各个模块分别部署在不同的多台机器上。

二十五、环境准备

1、克隆虚拟机

Vmware左侧选中要克隆的机器，这里对原有的BigData01机器进行克隆，虚拟机菜单中，选中管理菜单下的克隆命令。
选择“创建完整克隆”，虚拟机名称为BigData02，选择虚拟机文件保存路径，进行克隆。
再次克隆一个名为BigData03的虚拟机。

2、配置网络

修改网卡名称：

在BigData02和BigData03机器上编辑网卡信息。执行sudo vim /etc/udev/rules.d/70-persistent-net.rules命令。因为是从BigData01机器克隆来的，所以会保留BigData01的网卡eth0，并且再添加一个网卡eth1。并且eth0的Mac地址和BigData01的地址是一样的，Mac地址不允许相同，所以要删除eth0，只保留eth1网卡，并且要将eth1改名为eth0。将修改后的eth0的mac地址复制下来，修改network-scripts文件中的HWADDR属性。

sudo vim /etc/sysconfig/network-scripts/ifcfg-eth0
     
     
     
     
      
      
      
      1

修改网络参数：

BigData02机器IP改为192.168.100.12

BigData03机器IP改为192.168.100.13

3、配置Hostname

BigData02配置hostname为 bigdata-senior02.chybinmy.com

BigData03配置hostname为 bigdata-senior03.chybinmy.com

4、配置hosts

BigData01、BigData02、BigData03三台机器hosts都配置为：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         [hadoop@bigdata-senior01 hadoop-2.5.0]$ sudo vim /etc/hosts
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         192.168.100.10 bigdata-senior01.chybinmy.com
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         192.168.100.12 bigdata-senior02.chybinmy.com
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         192.168.100.13 bigdata-senior03.chybinmy.com
        
        
        
        
       
       
       
       
     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4

5、配置Windows上的SSH客户端

在本地Windows中的SSH客户端上添加对BigData02、BigData03机器的SSH链接。

二十六、服务器功能规划

bigdata-senior01.chybinmy.com	bigdata-senior02.chybinmy.com	bigdata-senior03.chybinmy.com
NameNode	ResourceManage
DataNode	DataNode	DataNode
NodeMan

你可能感兴趣的:(大数据和云计算)

人工智能在智能办公中的创新应用与未来趋势 Blossom.118 分布式系统与高性能计算领域机器学习人工智能 caffe 网络目标检测深度学习神经网络
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。随着人工智能（AI）技术的飞速发展，智能办公正在成为现代企业提升效率、优化管理的重要手段。智能办公通过集成AI、物联网（IoT）、大数据和云计算等技术，实现了办公环境的
CUDA中的并行计算与C++ AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术《CUDA中的并行计算与C++》技术博客文章引言1.1.背景介绍并行计算是一种可以利用多核处理器（CPU）和图形处理器（GPU）并行执行计算任务的技术。在当今大数据和云计算时代，如何有效地利用这些硬件资源以提高计算性能已成为一个重要挑战。CUDA（ComputeUnifiedDeviceArchitecture，统一设备架构）是一种并行计算框架，旨在使GPU和CPU能够
【liunx——docker容器技术】 YunNa@ liunx——docker容器 docker 运维容器
初学docker容器技术前言一、认识docker(并配置好Docker的基本运行环境)二、使用步骤设置docker仓库安装DockerCE：启动Docker并进行测试总结前言容器是继大数据和云计算之后的又一热门技术，越来越多的应用以容器的方式在开发、测试和生产环境中运行。作为目前较为流行的容器平台，Docker是开发、发布和运行应用的开放平台。利用Docker的快速发布、测试和部署的整套方法，可以
智能化转型下的后台管理系统构建——基于Trae框架的创新实践金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 网络人工智能区块链信息可视化
摘要：随着人工智能、大数据和云计算的快速发展，传统的后台管理系统逐渐面临着无法满足复杂需求和业务变化的挑战。本文探讨了在智能化转型的背景下，如何利用Trae框架设计和构建高效、智能的后台管理系统。通过对Trae框架的深入剖析，结合实际应用案例，本文分析了该框架在现代企业数字化转型中的重要作用，并提出了在智能管理系统中的前沿技术应用。最终，本文还附带了经典代码实现，帮助开发者更好地理解如何构建一个符
Yarn资源管理和任务调度原理与代码实例讲解杭州大厂Java程序媛 DeepSeek R1 &AI人工智能与大数据 java python javascript kotlin golang 架构人工智能
Yarn资源管理和任务调度原理与代码实例讲解1.背景介绍HadoopYARN（YetAnotherResourceNegotiator）是一个开源的分布式资源管理系统，负责分配集群中的计算资源，并调度各种分布式应用。YARN项目最初由Facebook开发，后来成为Apache基金会的顶级项目。1.1问题由来随着大数据和云计算技术的不断成熟，数据中心需要管理越来越多的工作负载。然而，现有的集中式资源
Java多线程与并发编程实战——从基础到进阶 AI天才研究院 Python实战 Java实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介互联网企业都在大力拓展自己的业务，而新的技术革命也带来了海量的数据量，因此，单机并发处理能力已经无法满足现代信息时代对高速数据的需求。大数据和云计算带来的分布式系统架构，让单台计算机不仅能够执行单个任务，而且可以横向扩展处理大量任务。在这种情况下，如何充分利用多核CPU、共享内存等资源并发地处理多项任务就成为现代系统设计者们必备技能之一。本书将以实操为导向，全面
大数据开发语言Scala入门编程小郭 scala 开发语言
大数据开发语言Scala的详解一、引言在大数据和云计算时代，数据的处理和分析变得尤为重要。为了有效地处理和分析这些数据，需要一种强大的编程语言。Scala作为一种多范式的编程语言，结合了面向对象编程和函数式编程的优点，为大数据开发提供了强大的支持。本文将详细介绍Scala及其优缺点、应用场景等。二、Scala概述Scala是由MartinOdersky教授于2003年开发的编程语言，旨在集成面向对
数据库审计：保障数据安全的重要措施 QoTypescript 数据库 oracle 数据安全
在当今信息时代，数据安全是一个备受关注的话题。随着大数据和云计算等技术的快速发展，数据库成为了存储和处理大量敏感数据的重要工具。为了确保数据的机密性、完整性和可用性，数据库审计成为了一项必要的措施。数据库审计是指对数据库系统中的操作进行监控、记录和分析的过程。通过审计，可以追踪和审查数据库的活动，包括用户的登录、查询、修改和删除等操作。这样可以及时发现和应对潜在的安全威胁，保护数据库中的重要信息不
深入解析 GBase 数据库集群架构：高可用与高性能的结合 big crab 数据库架构
引言在当今大数据和云计算的时代，企业级应用对数据库的需求不仅局限于数据存储，还需要满足高可用性、可扩展性和高性能等要求。GBase数据库以其强大的集群架构在行业内备受关注。本文将重点解析GBase数据库的集群架构设计，探讨其在高可用性、高性能和数据一致性方面的优势。一、GBase数据库集群架构的特点1.分布式存储与计算GBase的集群架构采用分布式存储与计算的设计，将数据分布到多个节点中，每个节点
Elasticsearch 就业形势狮歌~资深攻城狮 jenkins 运维
聊聊Elasticsearch在就业市场的现状和前景。Elasticsearch作为一种强大的搜索和分析引擎，近年来受到了越来越多企业和开发者的青睐。下面我们就来详细探讨一下Elasticsearch的就业形势。Elasticsearch就业形势1.市场需求概况技术趋势推动需求增长随着大数据和云计算技术的迅猛发展，企业对高效、可扩展的数据处理和分析能力的需求日益增强。Elasticsearch凭借
突破X86和ARM架构，RISC－V成为第三势力？ weixin_34306593 嵌入式人工智能大数据
相对IntelX86在服务器CPU，Arm在移动通讯装置的嵌入式CPU成功建立生态系，RISC-V的生态系只能说是在起步阶段。以前，人们提到处理器IP内核，想到的就是英特尔的X86和ARM架构，它们几乎“垄断”了PC和移动处理器市场。如今RISC-V以开源、低耗能高效能、可模块化与指令数简介等为特色被视为突破Intel、Arm架构垄断市场的新选择。随着AI、物联网、大数据和云计算的高速发展，低成本
Elasticsearch集群架构：构建高效、可扩展的搜索平台 detayun Elasticsearch elasticsearch 架构大数据
在当今大数据和云计算的时代，高效、实时的数据检索能力成为了企业核心竞争力的重要组成部分。Elasticsearch，作为一款基于Lucene构建的开源搜索引擎，以其强大的全文搜索能力、灵活的扩展性和丰富的功能特性，成为了众多企业首选的数据搜索和分析平台。本文将深入探讨Elasticsearch集群的架构设计，帮助您更好地理解和构建高效、可扩展的搜索解决方案。一、Elasticsearch简介Ela
乐学智伴：基于人工智能与大数据的学生个性化学习辅助平台 IT源码大师人工智能大数据学习
详细描述：1.引言：教育科技的时代背景在信息化和数字化的浪潮下，教育领域正经历着深刻的变革。传统的教学模式以教师为中心，难以满足学生个性化学习的需求。随着人工智能、大数据和云计算等技术的快速发展，教育科技（EdTech）为个性化学习提供了全新的解决方案。通过智能化工具和数据分析，学生可以根据自身的学习特点和进度，制定个性化的学习计划，从而提高学习效率和效果。“乐学智伴”是一款基于人工智能与大数据技
优化Docker容器技术实现MySQL主从复制部署的策略与实践天蓝蓝23528 docker mysql 容器
优化Docker容器技术实现MySQL主从复制部署的策略与实践引言随着大数据和云计算的快速发展，数据库的高可用性、可扩展性和易维护性成为了企业IT架构中的重要考量因素。MySQL作为一款流行的开源数据库管理系统，其主从复制（Master-SlaveReplication）功能为实现数据备份、故障恢复、读取扩展和数据分析提供了强有力的支持。然而，传统的MySQL主从复制部署过程复杂且容易出错，特别是
2018-10-23 天泽_e26a
关于信仰，今天罗老师在讲课的时候，有说到现在是一个互联网的时代，是一个云云数据大数据和云计算的时代，在这个时代所有东西都在改变，但是我们企业内部一个真正去应对所有改变最重要的一个资源和力量，就是来源于我们人的信念，现阶段所有的竞争的内容才能创造一个好的未来。然后紧接着罗老师说到了关于信仰怎么去体现的问题，在一个公司里面，我们可以通过一个公司的一个旗帜，还有公司的一个logo以及公司的领导人作为公司
echarts数据怎么赋值 vue_在vue中添加Echarts图表的基本使用教程对不起对不起 echarts数据怎么赋值 vue
前言我们在项目中经常需要使用一些折线图、柱状图、饼状图等等，之前使用过heightCharts，后来觉得这货不开源，只是做展示的话又点浪费时间，于是看了下eCharts，于是在vue-cli搭建的项目中添加了eCharts，下面是具体步骤和自己的一些学习笔记，参照于Echarts3官网现在的前端一般需要完成将大量的数据，实现可视化。现在是大数据和云计算的时代，所以数据可视化逐渐变成一种趋势。而EC
法律视角下的数据出境《2023年数据出境合规年鉴》云安全联盟大中华区数据安全 CSA大中华区数字安全
关注国际云安全联盟CSA公众号，回复关键词“数据安全”获取报告在全球数字产业以及大数据和云计算技术快速发展的背景下，数据流动对世界经济的影响日益显著。由此带来的数据红利和数据安全之间的冲突，将对未来数字经济的发展方向产生深刻影响。2023年可称为中国数据跨境监管的元年，这一年初出境评估的“蓬勃”和将近年末的数据出境法律调整“震荡”态势，说明着包括中国在内，数据跨境监管在各种国际和国内因素共同作用下
实现高可用与自动恢复的DevOps架构 OpenChat devops 架构运维
1.背景介绍在当今的数字时代，人工智能、大数据和云计算等技术已经成为企业竞争的核心能力。为了更好地满足业务需求，企业需要建立一个高效、高质量的DevOps架构。在这个过程中，实现高可用与自动恢复是非常重要的。高可用与自动恢复是指在系统中出现故障时，能够及时发现故障并进行自动恢复，以确保系统的稳定运行。这种能力对于企业的业务稳定性和竞争力具有重要意义。在DevOps架构中，高可用与自动恢复是通过多种
低代码开发业务在AIGC时代的应用液态不合群低代码 AIGC
随着人工智能和图形计算能力的快速发展，低代码开发平台在AIGC（人工智能，物联网，大数据和云计算）时代中扮演着至关重要的角色。本文将介绍低代码开发业务的概念和优势，探讨其在AIGC时代的应用及其对传统软件开发的影响。在过去的几年中，低代码开发平台逐渐崭露头角，成为企业加速数字化转型的关键工具之一。而在AIGC时代，人工智能、物联网、大数据和云计算的融合为低代码开发开辟了新的前景。本文将详细介绍低代
行程码为什么知道你在哪儿？粘木氏.嘚啵儿大数据大数据
前两天行程码的崩溃，挡住了不少人的上班路，公司在那头，而你在门口。行程码在疫情防疫中具有重要作用，它可以对你曾经的的停留地点进行定位。那么，行程码为什么知道你在哪儿呢？如果手机关机、拿掉SIM卡还能知道你在哪儿吗？行程码依托大数据和云计算行程码最重要的功能：过去14天你去过哪里。大数据会根据你去过的位置自动判断你的个人代码是否存在风险。有些人会问，我关掉手机，取出SIM卡，手机里没有我的个人信息，
未来科技五年人工智能行业产业发展趋势最新竞争力广州硅基技术官方科技人工智能
人工智能（ArtificialIntelligence，AI）是近年来快速发展的热门领域，被广泛应用于各个行业。随着技术的不断创新和突破，人工智能行业的竞争力也在不断提升。本文将分析未来科技五年人工智能行业产业发展趋势，并探讨其最新竞争力。首先，未来五年人工智能行业将继续保持高速发展。随着大数据和云计算技术的不断成熟，人工智能算法和模型的效果将得到大幅提升。同时，人工智能硬件设备的研发和制造也将迎
利用 Azure Data Bricks的免费资源学习云上大数据 AI普惠大师 azure 学习 microsoft
在这个数据驱动的时代，大数据和云计算已成为推动技术创新和商业智能的关键因素。AzureDatabricks，作为一个先进的云平台，为那些渴望深入了解和掌握这些技术的人们提供了一个理想的学习环境。我们这里将利用AzureDatabricks的免费资源，探索和学习云上大数据的奥秘。AzureDatabricks是一个基于ApacheSpark的分析平台，专为大数据处理和机器学习而设计。它结合了Data
对一个数据统计产品的设想 12_05
现在的计算机科技发展很快，包括大数据、云计算、人工智能、区块链、5G、AR/VR等等。这些概念最近几年一直都很火，对于计算机科学家的要求越来越高，但是，想要受到用户欢迎，技术是底层必要条件，加上好的产品才能是充分条件。微信是个好产品，但它用到的技术无非就是大数据技术吧，还有各种云计算技术。支付宝也是好产品，但它的核心技术也是数据库一致性技术，大数据和云计算技术。Google浏览器很不错。它用到了大
分布式系统架构设计之分布式消息队列基础知识灸哥漫谈架构师修炼导航分布式架构消息队列
随着微服务、大数据和云计算的普及，分布式系统已经成为现代软件架构的核心。在分布式系统中，各个组件间的通信和数据交换尤其重要，而消息队列正是实现这一目标的关键技术之一。在分布式架构设计过程中，架构师们需要对消息队列有极大的熟悉和关注，主要出于以下考虑：分布式消息队列允许不同的系统组件或者服务之间进行解耦，生产者和消费者可以在不必直接通信的情况下进行交互，从而提高系统的可扩展性和灵活性。此外，消息队列
如何做好固定资产管理？易点易动提供智能化方案 doris6100 固定资产固定资产管理系统设备管理
在大数据和云计算的时代，在固定资产管理模式上，各企业纷纷摆脱了手工管理的模式，开始使用固定资产管理系统将固定资产进行全生命周期管理和盘点，用于实时记录和追踪固定资产的状态和动态信息，严格控制实物资产管理成本，降低和优化企业支出和采购管理，促进企业更快更好地良性发展。使用固定资产管理系统后，企业的管理者可以随时掌握固定资产的整体的运行和状态，提高固定资产的管理效率。也从一定程度上提升了行政人员和IT
Java程序员真的还有未来吗?如何备战2024春招？并狂拿大厂offer？马士兵教育 java 开发语言程序员 Java面试面试程序人生 spring cloud
Java程序员还有未来吗?嘿，小伙伴们，你们有没有想过Java程序员还有没有未来？哈哈，别担心，我这就来给你们答疑解惑！首先，让我们来看看Java的发展历程。自从Java诞生以来，它就一直是编程界的一颗璀璨明星。从Web应用到企业级应用，再到移动应用，Java无处不在。那么，现在呢？现在，随着人工智能、大数据和云计算的兴起，Java依然发挥着重要的作用。这些领域都需要大量的Java程序员来支持它们
瑞幸咖啡用户运营的秘诀是什么？普通用户通过数据分析也能得到答案！数据猿用户运营数据分析墨刀产品运营数据挖掘
大数据产业创新服务媒体——聚焦数据·改变商业在快速发展的数字经济时代，BI已成为企业决策过程中不可或缺的工具。通过高效地收集、处理和分析海量数据，BI技术赋予企业洞察市场动态、优化运营策略、提升客户体验的能力。与人工智能、大数据和云计算的进一步融合，BI的应用范围和深度也在不断扩展，从而推动企业在竞争激烈的市场中保持领先。那么，在实际业务场景中，BI如何帮助企业实现数字化经营呢？要回答这个问题，用
软考系统架构设计师系列知识点之大数据（2）蓝天居士软考系统架构设计师系统架构软考大数据
接前一篇文章：软考系统架构设计师系列知识点之大数据（1）所属章节：第11章.未来信息综合技术第6节.云计算和大数据技术概述大数据和云计算已成为IT领域的两种主流技术。“数据是重要资产”这一概念已成为大家的共识，众多公司争相分析、挖掘大数据背后的重要财富。同时学术界、产业界和政府都对云计算产生了浓厚的兴趣：全球范围内讨论云计算技术学术活动如火如荼；谷歌、亚马逊、IBM、微软等IT巨头大力推动云计算的
云计算+大数据+AI其实就是企业服务平台跃過髙山
据有关行业人士声称：AI+大数据的应用会成为企业的标配，“过去是分析、现在是预测、未来是认知。”人工智能、大数据和云计算已经成为企业服务发展的主流趋势。企业服务平台首先我们来谈云计算，云计算大致有这3类分层服务：基础设施即服务（Iaas）、平台即服务（Paas）、软件即服务（Saas）。它大致分为这5大特点：大规模、分布式；虚拟化；高可用性和扩展性；按需服务更加经济；安全。那么大数据+AI又是这么
深眸科技聚焦AI+机器视觉产业化建设，加速智能制造国产替代升级深眸科技机器视觉人工智能制造计算机视觉
随着科技的不断发展，传统的制造生产已经无法满足现代制造业的需求，智能制造应运而生，以智能化、柔性化等生产优势，大幅提升制造效率和生产质量。智能制造是指具有信息自感知、自决策、自执行等功能的先进制造过程、系统与模式的总称。简单来说，就是将传统制造生产现代化赋能。智能化是赋能传统制造自动化的重要手段，通过引入AI、机器视觉等技术，以及大数据和云计算，实现对国内制造业生产过程的实时监控和预测性维护。但就
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l