咖喱东东

大数据学习系列：Hadoop3.0苦命学习（一）

传送门：
大数据学习系列：Hadoop3.0苦命学习（一）
大数据学习系列：Hadoop3.0苦命学习（二）
大数据学习系列：Hadoop3.0苦命学习（三）
大数据学习系列：Hadoop3.0苦命学习（四）
大数据学习系列：Hadoop3.0苦命学习（五）
大数据学习系列：Hadoop3.0苦命学习（六）
大数据学习系列：Hadoop3.0苦命学习（七）

内容包括：
（1）Hadoop的介绍
（2）集群环境搭建准备工作
（3）Linux命令和Shell脚本增强
（4）集群环境搭建

1 大数据概述
2 Hadoop介绍
- 2.1 问题一: 大文件怎么存储?
- 2.2 问题二: 大数据怎么计算?
- 2.3 问题三: 如何将这些计算任务跑在集群中?
- 2.4 Hadoop 的组成
2 环境搭建
- 2.1 创建虚拟机
- 2.2 网络模式详解
- 2.3 内存设置
- 2.4 集群规划
- 2.5 设置网卡名
- 2.6 设置ip和Mac地址
3 Liux常用的命令
- 3.1 查找命令
- 3.2 用户管理命令
- 3.3 用户权限管理命令
- 3.4 系统服务命令
4 Linux的Shell编程
- 4.1 变量
- 4.2 特殊字符
- 4.3 运算符
- 4.4 if语句
- 4.5 for语句
- 4.6 函数
5 环境配置
- 5.1 三台虚拟机关闭防火墙
- 5.2 三台机器关闭selinux
- 5.3 三台机器机器免密码登录
- 5.4 三台机器时钟同步
6 装辅助软件
- 6.1 每台主机安装jdk
7 Zookeeper
- 7.1 Zookeeper 的概述
- 7.2 Zookeeper安装
- 7.3 Zookeeper的Shell 客户端操作
8 Hadoop
- 8.1 Hadoop的介绍
- 8.2 hadoop的历史版本介绍
- 8.3 hadoop三大公司发型版本介绍
- 8.4、hadoop的架构模型（1.x，2.x的各种架构模型介绍）
- - 8.4.1 1.x的版本架构模型介绍
  - 8.4.2 2.x的版本架构模型介绍
- 8.5 Hadoop的安装
- - 8.5.1 上传并解压
  - 8.5.2 修改配置文件
  - - core-site.xml
    - hadoop-env.sh
    - hdfs-site.xml
    - mapred-site.xml
    - yarn-site.xml
    - workers
  - 8.5.3 创建数据和临时文件夹
  - 8.5.4 分发安装包到其它机器
  - 8.5.5 在每个节点配置环境变量
  - 8.5.6 格式化HDFS
  - 8.5.7 启动集群
  - 8.5.8 测试使用
  - 8.5.9 正常关闭集群(附加)

1 大数据概述

大数据：就是对海量数据进行分析处理，得到一些有价值的信息，然后帮助企业做出判断和决策。
处理流程：

获取数据
处理数据
展示结果

2 Hadoop介绍

Hadoop是一个分布式系基础框架,它允许使用简单的编程模型跨大型计算机的大型数据集进行分布式处理。
它主要解决两个问题：

大数据存储问题： HDFS
大数据计算问题：MapReduce

2.1 问题一: 大文件怎么存储?

假设一个文件非常非常大，大小为1PB, 大到世界上所有的高级计算机都存储不下, 怎么办?

为了保存大文件, 需要把文件放在多个机器上
- 文件要分块 block(128M)
- 不同的块放在不同的 HDFS 节点
同时为了对外提供统一的访问, 让外部可以像是访问本机一样访问分布式文件系统
- 有一个统一的 HDFS Master
- 它保存整个系统的文件信息
- 所有的文件元数据的修改都从 Master 开始

2.2 问题二: 大数据怎么计算?

从一个网络日志文件中计算独立 IP, 以及其出现的次数
如果数据量特别大，我们可以将,整个任务拆开, 划分为比较小的任务, 从而进行计算呢。

2.3 问题三: 如何将这些计算任务跑在集群中?

如果能够在不同的节点上并行执行, 更有更大的提升, 如何把这些任务跑在集群中?

可以设置一个集群的管理者, 这个地方叫做 Yarn

这个集群管理者有一个 Master, 用于接收和分配任务
这个集群管理者有多个 Slave, 用于运行任务

2.4 Hadoop 的组成

Hadoop分布式文件系统(HDFS) 提供对应用程序数据的高吞吐量访问的分布式文件系统

Hadoop Common 其他Hadoop模块所需的Java库和实用程序。这些库提供文件系统和操作系统级抽象，并包含启动Hadoop所需的必要Java文件和脚本
Hadoop MapReduce 基于YARN的大型数据集并行处理系统
Hadoop YARN 作业调度和集群资源管理的框架

2 环境搭建

在 Hadoop 具体开始前, 先来搭建一下环境:

创建虚拟机
1. 安装虚拟机 VMWare
2. 创建虚拟机
3. 安装 CentOS
4. 组成集群
配置每台主机
1. 关闭防火墙
2. 关闭 SELinux
3. 设置主机名
4. 重启
5. 设置时钟同步服务
6. 配置用户权限
7. 免密登录
安装辅助软件
1. JDK
2. Zookeeper
安装 Hadoop
1. 下载并解压
2. 修改配置
3. 分发到每个节点
4. 格式化 HDFS
5. 启动集群

2.1 创建虚拟机

1：通过ISO镜像安装

2: 直接复制安装好的虚拟机
注意事项：windows系统确认所有的关于VmWare的服务都已经启动

确认好VmWare生成的网关地址，

另外确认VmNet8网卡已经配置好了IP地址。

网络模式
内存设置
规划集群, 创建多台虚拟机

2.2 网络模式详解

桥接

把虚拟出来的网卡直接连接外部的路由器, 看起来就好像是网络中多出了一台真正的计算机一样
从路由器来看, 虚拟机等同于局域网内其它的物理机

NAT

在宿主机中创建一个子网, 把虚拟机放入子网中, 子网中有一个NAT服务

仅主机

创建子网, 把虚拟机放入这个子网

2.3 内存设置

需要三台虚拟机, 并且需要同时运行, 所以总体上的占用为: $\times 3$
在分配的时候, 需要在总内存大小的基础上, 减去1-2G作为系统内存, 剩余的除以3, 作为每台虚拟机的内存

$\left ( 总内存 - 4\right ) \div 3$

2.4 集群规划

IP	主机名	环境配置	安装
192.168.188.100	node01	关防火墙和selinux, host映射, 时钟同步	JDK, NameNode, ResourceManager, Zookeeper
192.168.188.110	node02	关防火墙和selinux, host映射, 时钟同步	JDK, DataNode, NodeManager, Zeekeeper
192.168.188.120	node03	关防火墙和selinux, host映射, 时钟同步	JDK, DataNode, NodeManager, Zeekeeper

2.5 设置网卡名

用ifconfig查看网卡名称为ens33，现在要将它修改成eth0
编辑配置文件/etc/sysconfig/network-scripts/ifcfg-ens33
重命名该配置文件
cd /etc/sysconfig/network-scripts/
mv ifcfg-ens33 ifcfg-eth0
编辑/etc/default/grub并加入net.ifnames=0 biosdevname=0

5. 运行命令grub2-mkconfig -o /boot/grub2/grub.cfg 来重新生成GRUB配置并更新内核参数

6. 使用reboot命令重启操作系统
7. 再次查看网卡名称

2.6 设置ip和Mac地址

更改mac地址：
vim /etc/udev/rules.d/70-persistent-net.rules
更改IP地址:
vim /etc/sysconfig/network-scripts/ifcfg-eth0，更改内容同2.5
修改主机名(重启后永久生效)
vi /ect/sysconfig/network，增加内容如下：
设置ip和域名映射
vim /etc/hosts，增加内容如下：

5. 执行reboot重启，并执行ping www.baidu.com看是否配置网络成功

3 Liux常用的命令

3.1 查找命令

grep命令命令是一种强大的文本搜索工具

格式： grep [option] pattern [file] 可使用 —help 查看更多参数。使用实例：

ps -ef | grep sshd 查找指定 ssh 服务进程

ps -ef | grep sshd | grep -v grep 查找指定服务进程，排除 gerp 本身

grep -n 'hello' a.txt 从文件中查找关键词，并显示行号

find命令

find 命令在目录结构中搜索文件，并对搜索结果执行指定的操作。
使用实例：
find . -name "*.log" -ls 在当前目录查找以.log 结尾的文件，并显示详细信息。

find /root/ -perm 777 查找/root/目录下权限为 777 的文件

find . -size +100M 查找当前目录大于 100M 的文件

Locate命令

locate 让使用者可以很快速的搜寻档案系统内是否有指定的档案。其方法
是先建立一个包括系统内所有档案名称及路径的数据库。之后当寻找时就只需查
询这个数据库（ /var/lib/locatedb）。
Linux 系统自动创建这个数据库，默认每天自动更新一次，所以使用 locate
命令查不到最新变动过的文件。为了避免这种情况，可以在使用 locate 之前，
先使用 updatedb 命令，手动更新数据库。
yum -y install mlocate
使用实例：
locate /etc/sh
搜索 etc 目录下所有以 sh 开头的文件

locate pwd
查找和 pwd 相关的所有文件

3.2 用户管理命令

添加普通用户

useradd hadoop # 这个就表示我们创建了一个普通用户

passwd hadoop # 表示我们需要给hadoop这个普通用户分配一个密码

切换用户:

su - 用户名

规则：(1)root用户到其他用户不需要输入密码，反之要输入；(2) " - "可以理解为切换用户的同时切换环境，而不加它仅仅切换用户。

3.3 用户权限管理命令

chmod 777 a.txt #表示给某个文件赋予所有人的所有权限

chmod u-x a.txt #取消a.txt文件，用户“执行”权限

chmod g+x a.txt #添加a.txt文件，组“执行”权限

chown -R hadoop:hadoop a.txt 改变某个文件或者文件夹的所属的用户以及用户组

3.4 系统服务命令

service iptables status #查看防火墙状态

service iptables stop #关闭防火墙

service --status-all # 查看系统所有的后台服务进程
service sshd status # 查看指定的后台服务进程的状态
service sshd stop
service sshd start
service sshd restart
配置后台服务进程的开机自启或关闭

chkconfig iptables on #配置防火墙开机开启

chkconfig iptables off #配置防火墙开机关闭
chkconfig httpd on ## 让 httpd 服务开机自启
chkconfig httpd off ## 让 httpd 服务开机不要自启

4 Linux的Shell编程

Shell 编程一般指 shell 脚本编程。

语法:

使用 vi 编辑器新建一个文件 hello.sh

#!/bin/bash 
 echo "Hello World !"

执行：

方式1：

sh hello.sh

方式2

chmod +x ./hello.sh #使脚本具有执行权限

./hello.sh #执行脚本

4.1 变量

局部变量

#!/bin/bash
str="hello"
echo ${str}world

环境变量
可以自己设置新的环境变量，通过export key=value完成设置。

之后，先通过source /etc/profile使生效，再通过env命令查询所有环境变量：

ps:可以通过echo $PATH、echo $HOME打印某一环境变量的值

4.2 特殊字符

命令	作用
$#	传递到脚本的参数个数
$*	以一个单字符串显示所有向脚本传递的参数。
$$	脚本运行的当前进程 ID 号
$!	后台运行的最后一个进程的 ID 号
$@	与$*相同，但是使用时加引号，并在引号中返回每个参数。
$?	显示最后命令的退出状态。 0 表示没有错误，其他任何值表明有错误。

#!/bin/bash
echo "第一个参数为： $1";
echo "参数个数为： $#";
echo "传递的参数作为一个字符串显示： $*";

执行: ./test.sh 1 2 3

4.3 运算符

#!/bin/bash
a=1;
b=2;
echo `expr $a + $b`;
echo  $((a+b));
echo  $[a+b];

执行结果：

4.4 if语句

#!/bin/bash
read -p "please input your name:" NAME ## read命令用于从控制台读取输入数据
## printf '%s\n' $NAME
if [ $NAME = root ]
  then
  	echo "hello ${NAME}, welcome !"
  elif [ $NAME = itcast ]
  then
  	echo "hello ${NAME}, welcome !"
  else
  	echo "Get out Please!"
fi

执行结果：

4.5 for语句

方式1：

#!/bin/bash
for N in 1 2 3 
do
    echo $N
done

执行结果：

方式2：

#!/bin/bash
for ((i = 0; i <= 5; i++)) 
 do 
    echo "welcome $i times" 
 done

4.6 函数

#!/bin/bash
funWithReturn(){
echo "这个函数会对输入的两个数字进行相加运算..."
echo "输入第一个数字: "
read aNum
echo "输入第二个数字: "
read anotherNum
echo "两个数字分别为 $aNum 和 $anotherNum !"
return $(($aNum+$anotherNum))
} 
funWithReturn
echo "输入的两个数字之和为 $? !"

执行结果：

5 环境配置

5.1 三台虚拟机关闭防火墙

三台机器执行以下命令（root用户来执行）

systemctl stop iptables   #关闭防火墙
systemctl disable iptables.service  #禁止开机启动

5.2 三台机器关闭selinux

什么是SELinux
- SELinux是Linux的一种安全子系统
- Linux中的权限管理是针对于文件的, 而不是针对进程的, 也就是说, 如果root启动了某个进程, 则这个进程可以操作任何一个文件
- SELinux在Linux的文件权限之外, 增加了对进程的限制, 进程只能在进程允许的范围内操作资源
为什么要关闭SELinux
- 如果开启了SELinux, 需要做非常复杂的配置, 才能正常使用系统, 在学习阶段, 在非生产环境, 一般不使用SELinux
SELinux的工作模式
- enforcing 强制模式
- permissive 宽容模式
- disable 关闭

# 修改selinux的配置文件
vi /etc/selinux/config

改成SELINUX=disabled

5.3 三台机器机器免密码登录

为什么要免密登录
- Hadoop 节点众多, 所以一般在主节点启动从节点, 这个时候就需要程序自动在主节点登录到从节点中, 如果不能免密就每次都要输入密码, 非常麻烦
免密 SSH 登录的原理
1. 需要先在 B节点配置 A节点的公钥
2. A节点请求 B节点要求登录
3. B节点使用 A节点的公钥, 加密一段随机文本
4. A节点使用私钥解密, 并发回给 B节点
5. B节点验证文本是否正确

第一步：三台机器生成公钥与私钥

在三台机器执行以下命令，生成公钥与私钥

ssh-keygen -t rsa

执行该命令之后，按下三个回车即可

第二步：拷贝公钥到同一台机器

三台机器将拷贝公钥到第一台机器

三台机器执行命令：

ssh-copy-id node01

第三步:复制第一台机器的认证到其他机器

将第一台机器的公钥拷贝到其他机器上

在第一台机器上面指向以下命令

scp /root/.ssh/authorized_keys node02:/root/.ssh

scp /root/.ssh/authorized_keys node03:/root/.ssh

测试免密登录：

5.4 三台机器时钟同步

为什么需要时间同步
- 因为很多分布式系统是有状态的, 比如说存储一个数据, A节点记录的时间是 1, B节点记录的时间是 2, 就会出问题

## 安装
yum install -y ntp

## 启动定时任务
crontab -e
## 查看定时任务
crontab -l

随后在输入界面键入

*/1 * * * * /usr/sbin/ntpdate ntp4.aliyun.com;

6 装辅助软件

6.1 每台主机安装jdk

查看自带的openjdk

rpm -qa | grep java

卸载系统自带的openjdk

rpm -e java-1.8.0-openjdk-1.8.0.242.b08-1.el7.x86_64 tzdata-java-2019c-1.el7.noarch java-1.8.0-openjdk-headless-1.8.0.242.b08-1.el7.x86_64 python-javapackages-3.4.1-11.el7.noarch javapackages-tools-3.4.1-11.el7.noarch --nodeps

上传jdk并解压然后配置环境变量

所有软件的安装路径

mkdir -p /export/services

所有软件压缩包的存放路径

mkdir -p /export/softwares

上传jdk到/export/softwares路径下去

rz -E，若不能使用该命令，请先执行yum -y install lrzsz进行下载。

解压

tar -zxvf jdk-8u251-linux-x64.tar.gz -C ../services/

配置环境变量

vim /etc/profile

export JAVA_HOME=/export/services/jdk1.8.0_251
export PATH=:$JAVA_HOME/bin:$PATH

修改完成之后记得 source /etc/profile生效

快捷方式：当装完一台虚拟机的jdk后，可通过scp -r jdk1.8.0_251/ node03:$PWD分发已上传的jdk

7 Zookeeper

7.1 Zookeeper 的概述

Zookeeper 是一个开源的分布式协调服务框架 ,主要用来解决分布式集群中应用系统的一致性问题
Zookeeper 是 Google Chubby 思想的一个开源实现
Zookeeper 本质上是一个分布式文件系统, 适合存放小文件, 通过文件系统来实现分布式协调

分布式文件系统?

在上图左侧, Zookeeper 中存储的其实是一个又一个 Znode, Znode 是 Zookeeper 中的节点
- Znode 是有路径的, 例如 /data/host1, /data/host2, 这个路径也可以理解为是 Znode 的 Name
- Znode 也可以携带数据, 例如说某个 Znode 的路径是 /data/host1, 其值是一个字符串 "192.168.0.1"
正因为 Znode 的特性, 所以 Zookeeper 可以对外提供出一个类似于文件系统的试图, 可以通过操作文件系统的方式操作 Zookeeper
- 使用路径获取 Znode
- 获取 Znode 携带的数据
- 修改 Znode 携带的数据
- 删除 Znode
- 添加 Znode
- 等等…

Zookeeper 是分布式的

首先呢, Zookeeper 是分为服务端和客户端的, 客户端有 Java 的客户端, 有 Shell 命令行的客户端等, 客户端通过一个类似于文件系统的 API 来访问 Zookeeper 集群

但是事实上, 客户端最终是直接访问 Zookeeper 集群, 集群中有两大类角色, 一类是 Leader, 一类是 Follower, 其实就是主从, Leader 负责读和写, Follower 只能读, 遇到会产生修改的请求会转发给 Leader 处理, 这是因为 Zookeeper 本质上就是为了在分布式环境中对消息的一致性的支持, 而 Zookeeper 所基于的 ZAB 协议是 Paxos 协议的一个变种, ZAB 协议中是有一个全局的事务生成者, 就是 Leader, 修改设计到在分布式环境下对事务达成一致, 必须由 Leader 发起

举个例子?

比如说一个常见的分布式主从系统, 如果有 ZK 在的话, 主节点不需要和每个从节点保持连接, 只需要监听从节点创建的 Znode, 便可以知道谁在线

Zookeeper 能做什么?

发布订阅
命名服务
分布式锁
分布式协调

7.2 Zookeeper安装

服务器IP	主机名	myid的值
192.168.188.100	node01	1
192.168.188.110	node02	2
192.168.188.120	node03	3

第一步：下载zookeeeper的压缩包，下载网址如下

http://archive.apache.org/dist/zookeeper/

我们在这个网址下载我们使用的zk版本为3.4.9

下载完成之后，上传到我们的linux的/export/softwares路径下准备进行安装

第二步：解压

解压zookeeper的压缩包到/export/services路径下去，然后准备进行安装

cd /export/software

tar -zxvf zookeeper-3.4.9.tar.gz -C ../services/

第三步：修改配置文件

第一台机器修改配置文件

cd /export/services/zookeeper-3.4.9/conf/

cp zoo_sample.cfg zoo.cfg

mkdir -p /export/services/zookeeper-3.4.9/zkdatas/

vim zoo.cfg

dataDir=/export/services/zookeeper-3.4.9/zkdatas
# 保留多少个快照
autopurge.snapRetainCount=3
# 日志多少小时清理一次
autopurge.purgeInterval=1
# 集群中服务器地址
server.1=node01:2888:3888
server.2=node02:2888:3888
server.3=node03:2888:3888

第四步：添加myid配置

在第一台机器的

/export/services/zookeeper-3.4.9/zkdatas /这个路径下创建一个文件，文件名为myid ,文件内容为1

echo 1 > /export/services/zookeeper-3.4.9/zkdatas/myid

第五步：安装包分发并修改myid的值

安装包分发到其他机器

第一台机器上面执行以下两个命令

scp -r /export/services/zookeeper-3.4.9/ node02:/export/services/

scp -r /export/services/zookeeper-3.4.9/ node03:/export/services/

第二台机器上修改myid的值为2

echo 2 > /export/services/zookeeper-3.4.9/zkdatas/myid

第三台机器上修改myid的值为3

echo 3 > /export/services/zookeeper-3.4.9/zkdatas/myid

第六步：三台机器启动zookeeper服务

三台机器启动zookeeper服务

这个命令三台机器都要执行

/export/services/zookeeper-3.4.9/bin/zkServer.sh start

查看启动状态

/export/services/zookeeper-3.4.9/bin/zkServer.sh status

遇到错误：java.net.NoRouteToHostException: 没有到主机的路由 (Host unreachable)
解决：
原因：防火墙没关！，每一台机器依次执行：

systemctl stop firewalld.service #停止firewall

systemctl disable firewalld.service #禁止firewall开机启动

firewall-cmd --state #查看默认防火墙状态（关闭后显示notrunning，开启后显示running）

7.3 Zookeeper的Shell 客户端操作

通过zkCli.sh命令启动。

命令	说明	参数
`create [-s] [-e] path data acl`	创建Znode	-s 指定是顺序节点 -e 指定是临时节点
`ls path [watch]`	列出Path下所有子Znode
`get path [watch]`	获取Path对应的Znode的数据和属性
`ls2 path [watch]`	查看Path下所有子Znode以及子Znode的属性
`set path data [version]`	更新节点	version 数据版本
`delete path [version]`	删除节点, 如果要删除的节点有子Znode则无法删除	version 数据版本
`rmr path`	删除节点, 如果有子Znode则递归删除
`setquota -n\|-b val path`	修改Znode配额	-n 设置子节点最大个数 -b 设置节点数据最大长度
`history`	列出历史记录

1：创建普通节点

create /app1 hello

2: 创建顺序节点

create -s /app3 world

3:创建临时节点

create -e /tempnode world

4:创建顺序的临时节点

create -s -e /tempnode2 aaa

5:获取节点数据

get /app1

6:修改节点数据

set /app1 xxx

7:删除节点

delete /app1 删除的节点不能有子节点

rmr /app1 递归删除

Znode 的特点

文件系统的核心是 Znode
如果想要选取一个 Znode, 需要使用路径的形式, 例如 /test1/test11
Znode 本身并不是文件, 也不是文件夹, Znode 因为具有一个类似于 Name 的路径, 所以可以从逻辑上实现一个树状文件系统
ZK 保证 Znode 访问的原子性, 不会出现部分 ZK 节点更新成功, 部分 ZK 节点更新失败的问题
Znode 中数据是有大小限制的, 最大只能为1M
Znode是由三个部分构成
- stat: 状态, Znode的权限信息, 版本等
- data: 数据, 每个Znode都是可以携带数据的, 无论是否有子节点
- children: 子节点列表

Znode 的类型

每个Znode有两大特性, 可以构成四种不同类型的Znode
- 持久性
  - 持久 客户端断开时, 不会删除持有的Znode
  - 临时 客户端断开时, 删除所有持有的Znode, 临时Znode不允许有子Znode
- 顺序性
  - 有序 创建的Znode有先后顺序, 顺序就是在后面追加一个序列号, 序列号是由父节点管理的自增
  - 无序 创建的Znode没有先后顺序
Znode的属性
- dataVersion 数据版本, 每次当Znode中的数据发生变化的时候, dataVersion都会自增一下
- cversion 节点版本, 每次当Znode的节点发生变化的时候, cversion都会自增
- aclVersion ACL(Access Control List)的版本号, 当Znode的权限信息发生变化的时候aclVersion会自增
- zxid 事务ID
- ctime 创建时间
- mtime 最近一次更新的时间
- ephemeralOwner 如果Znode为临时节点, ephemeralOwner表示与该节点关联的SessionId

通知机制

通知类似于数据库中的触发器, 对某个Znode设置 Watcher, 当Znode发生变化的时候, WatchManager会调用对应的Watcher
当Znode发生删除, 修改, 创建, 子节点修改的时候, 对应的Watcher会得到通知
Watcher的特点
- 一次性触发 一个 Watcher 只会被触发一次, 如果需要继续监听, 则需要再次添加 Watcher
- 事件封装: Watcher 得到的事件是被封装过的, 包括三个内容 keeperState, eventType, path

KeeperState	EventType	触发条件	说明
	None	连接成功
SyncConnected	NodeCreated	Znode被创建	此时处于连接状态
SyncConnected	NodeDeleted	Znode被删除	此时处于连接状态
SyncConnected	NodeDataChanged	Znode数据被改变	此时处于连接状态
SyncConnected	NodeChildChanged	Znode的子Znode数据被改变	此时处于连接状态
Disconnected	None	客户端和服务端断开连接	此时客户端和服务器处于断开连接状态
Expired	None	会话超时	会收到一个SessionExpiredException
AuthFailed	None	权限验证失败	会收到一个AuthFailedException

会话

在ZK中所有的客户端和服务器的交互都是在某一个Session中的, 客户端和服务器创建一个连接的时候同时也会创建一个Session
Session会在不同的状态之间进行切换: CONNECTING, CONNECTED, RECONNECTING, RECONNECTED, CLOSED
ZK中的会话两端也需要进行心跳检测, 服务端会检测如果超过超时时间没收到客户端的心跳, 则会关闭连接, 释放资源, 关闭会话

8 Hadoop

8.1 Hadoop的介绍

Hadoop最早起源于Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎，包括网页抓取、索引、查询等功能，但随着抓取网页数量的增加，遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题。
2003年、2004年谷歌发表的两篇论文为该问题提供了可行的解决方案。

——分布式文件系统（GFS），可用于处理海量网页的存储

——分布式计算框架MAPREDUCE，可用于处理海量网页的索引计算问题。

Nutch的开发人员完成了相应的开源实现HDFS和MAPREDUCE，并从Nutch中剥离成为独立项目HADOOP，到2008年1月，HADOOP成为Apache顶级项目.

狭义上来说，hadoop就是单独指代hadoop这个软件，

HDFS ：分布式文件系统

MapReduce : 分布式计算系统

广义上来说，hadoop指代大数据的一个生态圈，包括很多其他的软件

8.2 hadoop的历史版本介绍

1.x版本系列：hadoop版本当中的第二代开源版本，主要修复0.x版本的一些bug等

2.x版本系列：架构产生重大变化，引入了yarn平台等许多新特性

3.x版本系列: 加入多namenoode新特性

8.3 hadoop三大公司发型版本介绍

免费开源版本apache:

http://hadoop.apache.org/

优点：拥有全世界的开源贡献者，代码更新迭代版本比较快，

缺点：版本的升级，版本的维护，版本的兼容性，版本的补丁都可能考虑不太周到，\

apache所有软件的下载地址（包括各种历史版本）：

http://archive.apache.org/dist/

免费开源版本hortonWorks：

https://hortonworks.com/

hortonworks主要是雅虎主导Hadoop开发的副总裁，带领二十几个核心成员成立Hortonworks，核心产品软件HDP（ambari），HDF免费开源，并且提供一整套的web管理界面，供我们可以通过web界面管理我们的集群状态，web管理界面软件HDF网址（http://ambari.apache.org/）

软件收费版本ClouderaManager:

https://www.cloudera.com/

cloudera主要是美国一家大数据公司在apache开源hadoop的版本上，通过自己公司内部的各种补丁，实现版本之间的稳定运行，大数据生态圈的各个版本的软件都提供了对应的版本，解决了版本的升级困难，版本兼容性等各种问题

8.4、hadoop的架构模型（1.x，2.x的各种架构模型介绍）

8.4.1 1.x的版本架构模型介绍

文件系统核心模块：

NameNode：集群当中的主节点，管理元数据(文件的大小，文件的位置，文件的权限)，主要用于管理集群当中的各种数据

secondaryNameNode：主要能用于hadoop当中元数据信息的辅助管理

DataNode：集群当中的从节点，主要用于存储集群当中的各种数据

数据计算核心模块：

JobTracker：接收用户的计算请求任务，并分配任务给从节点

TaskTracker：负责执行主节点JobTracker分配的任务

8.4.2 2.x的版本架构模型介绍

第一种：NameNode与ResourceManager单节点架构模型

文件系统核心模块：

NameNode：集群当中的主节点，主要用于管理集群当中的各种数据

secondaryNameNode：主要能用于hadoop当中元数据信息的辅助管理

DataNode：集群当中的从节点，主要用于存储集群当中的各种数据

数据计算核心模块：

ResourceManager：接收用户的计算请求任务，并负责集群的资源分配

NodeManager：负责执行主节点APPmaster分配的任务

第二种：NameNode单节点与ResourceManager高可用架构模型

文件系统核心模块：

NameNode：集群当中的主节点，主要用于管理集群当中的各种数据

secondaryNameNode：主要能用于hadoop当中元数据信息的辅助管理

DataNode：集群当中的从节点，主要用于存储集群当中的各种数据

数据计算核心模块：

ResourceManager：接收用户的计算请求任务，并负责集群的资源分配，以及计算任务的划分，通过zookeeper实现ResourceManager的高可用

NodeManager：负责执行主节点ResourceManager分配的任务

第三种：NameNode高可用与ResourceManager单节点架构模型

文件系统核心模块：

NameNode：集群当中的主节点，主要用于管理集群当中的各种数据，其中nameNode可以有两个，形成高可用状态

DataNode：集群当中的从节点，主要用于存储集群当中的各种数据

JournalNode：文件系统元数据信息管理

数据计算核心模块：

ResourceManager：接收用户的计算请求任务，并负责集群的资源分配，以及计算任务的划分

NodeManager：负责执行主节点ResourceManager分配的任务

第四种：NameNode与ResourceManager高可用架构模型

文件系统核心模块：

NameNode：集群当中的主节点，主要用于管理集群当中的各种数据，一般都是使用两个，实现HA高可用

JournalNode：元数据信息管理进程，一般都是奇数个

DataNode：从节点，用于数据的存储

数据计算核心模块：

ResourceManager：Yarn平台的主节点，主要用于接收各种任务，通过两个，构建成高可用

NodeManager：Yarn平台的从节点，主要用于处理ResourceManager分配的任务

8.5 Hadoop的安装

集群的规划:

服务器IP	192.168.188.100	192.168.188.110	192.168.188.120
主机名	node01	node02	node03
NameNode	是	否	否
SecondaryNameNode	是	否	否
dataNode	是	是	是
ResourceManager	是	否	否
NodeManager	是	是	是

上传并解压
修改配置文件
分发安装包
格式化HDFS
启动集群

8.5.1 上传并解压

上传压缩包到/export/software目录
cd /export/software
tar xzvf hadoop-3.1.1.tar.gz -C ../services

8.5.2 修改配置文件

配置文件的位置在 hadoop/etc/hadoop

core-site.xml

<configuration>
    <property>
		<name>fs.defaultFSname>
		<value>hdfs://node01:8020value>
	property>
	
	<property>
		<name>hadoop.tmp.dirname>
		<value>/export/services/hadoop-3.1.1/datas/tmpvalue>
	property>
    
	<property>
		<name>io.file.buffer.sizename>
		<value>8192value>
	property>
    
	<property>
		<name>fs.trash.intervalname>
		<value>10080value>
	property>
configuration>

hadoop-env.sh

export JAVA_HOME=/export/services/jdk1.8.0_251

hdfs-site.xml

<configuration>
	<property>
		<name>dfs.namenode.name.dirname>
		<value>file:///export/services/hadoop-3.1.1/datas/namenode/namenodedatasvalue>
	property>
	<property>
		<name>dfs.blocksizename>
		<value>134217728value>
	property>
	<property>
		<name>dfs.namenode.handler.countname>
		<value>10value>
	property>
	<property>
		<name>dfs.datanode.data.dirname>
		<value>file:///export/services/hadoop-3.1.1/datas/datanode/datanodeDatasvalue>
	property>
	<property>
		<name>dfs.namenode.http-addressname>
		<value>node01:50070value>
	property>
	<property>
		<name>dfs.replicationname>
		<value>3value>
	property>
	<property>
		<name>dfs.permissions.enabledname>
		<value>falsevalue>
	property>
	<property>
		<name>dfs.namenode.checkpoint.edits.dirname>
		<value>file:///export/services/hadoop-3.1.1/datas/dfs/nn/snn/editsvalue>
	property>
	<property>
		<name>dfs.namenode.secondary.http-addressname>
		<value>node01.hadoop.com:50090value>
	property>
	<property>
		<name>dfs.namenode.edits.dirname>
		<value>file:///export/services/hadoop-3.1.1/datas/dfs/nn/editsvalue>
	property>
	<property>
		<name>dfs.namenode.checkpoint.dirname>
		<value>file:///export/services/hadoop-3.1.1/datas/dfs/snn/namevalue>
	property>
configuration>

mapred-site.xml

<configuration>
	<property>
		<name>mapreduce.framework.namename>
		<value>yarnvalue>
	property>
	<property>
		<name>mapreduce.map.memory.mbname>
		<value>1024value>
	property>
	<property>
		<name>mapreduce.map.java.optsname>
		<value>-Xmx512Mvalue>
	property>
	<property>
		<name>mapreduce.reduce.memory.mbname>
		<value>1024value>
	property>
	<property>
		<name>mapreduce.reduce.java.optsname>
		<value>-Xmx512Mvalue>
	property>
	<property>
		<name>mapreduce.task.io.sort.mbname>
		<value>256value>
	property>
	<property>
		<name>mapreduce.task.io.sort.factorname>
		<value>100value>
	property>
	<property>
		<name>mapreduce.reduce.shuffle.parallelcopiesname>
		<value>25value>
	property>
	<property>
		<name>mapreduce.jobhistory.addressname>
		<value>node01.hadoop.com:10020value>
	property>
	<property>
		<name>mapreduce.jobhistory.webapp.addressname>
		<value>node01.hadoop.com:19888value>
	property>
	<property>
		<name>mapreduce.jobhistory.intermediate-done-dirname>
		<value>/export/services/hadoop-3.1.1/datas/jobhsitory/intermediateDoneDatasvalue>
	property>
	<property>
		<name>mapreduce.jobhistory.done-dirname>
		<value>/export/services/hadoop-3.1.1/datas/jobhsitory/DoneDatasvalue>
	property>
	<property>
	  <name>yarn.app.mapreduce.am.envname>
	  <value>HADOOP_MAPRED_HOME=/export/services/hadoop-3.1.1value>
	property>
	<property>
	  <name>mapreduce.map.envname>
	  <value>HADOOP_MAPRED_HOME=/export/services/hadoop-3.1.1/value>
	property>
	<property>
	  <name>mapreduce.reduce.envname>
	  <value>HADOOP_MAPRED_HOME=/export/services/hadoop-3.1.1value>
	property>
configuration>

yarn-site.xml

<configuration>
	<property>
		<name>dfs.namenode.handler.countname>
		<value>100value>
	property>
	<property>
		<name>yarn.log-aggregation-enablename>
		<value>truevalue>
	property>
	<property>
		<name>yarn.resourcemanager.addressname>
		<value>node01:8032value>
	property>
	<property>
		<name>yarn.resourcemanager.scheduler.addressname>
		<value>node01:8030value>
	property>
	<property>
		<name>yarn.resourcemanager.resource-tracker.addressname>
		<value>node01:8031value>
	property>
	<property>
		<name>yarn.resourcemanager.admin.addressname>
		<value>node01:8033value>
	property>
	<property>
		<name>yarn.resourcemanager.webapp.addressname>
		<value>node01:8088value>
	property>
	<property>
		<name>yarn.resourcemanager.hostnamename>
		<value>node01value>
	property>
	<property>
		<name>yarn.scheduler.minimum-allocation-mbname>
		<value>1024value>
	property>
	<property>
		<name>yarn.scheduler.maximum-allocation-mbname>
		<value>2048value>
	property>
	<property>
		<name>yarn.nodemanager.vmem-pmem-rationame>
		<value>2.1value>
	property>
	
	<property>
		<name>yarn.nodemanager.vmem-check-enabledname>
		<value>falsevalue>
	property>
	<property>
		<name>yarn.nodemanager.resource.memory-mbname>
		<value>1024value>
	property>
	<property>
		<name>yarn.nodemanager.resource.detect-hardware-capabilitiesname>
		<value>truevalue>
	property>
	<property>
		<name>yarn.nodemanager.local-dirsname>
		<value>file:///export/services/hadoop-3.1.1/datas/nodemanager/nodemanagerDatasvalue>
	property>
	<property>
		<name>yarn.nodemanager.log-dirsname>
		<value>file:///export/services/hadoop-3.1.1/datas/nodemanager/nodemanagerLogsvalue>
	property>
	<property>
		<name>yarn.nodemanager.log.retain-secondsname>
		<value>10800value>
	property>
	<property>
		<name>yarn.nodemanager.remote-app-log-dirname>
		<value>/export/services/hadoop-3.1.1/datas/remoteAppLog/remoteAppLogsvalue>
	property>
	<property>
		<name>yarn.nodemanager.remote-app-log-dir-suffixname>
		<value>logsvalue>
	property>
	<property>
		<name>yarn.nodemanager.aux-servicesname>
		<value>mapreduce_shufflevalue>
	property>
	<property>
		<name>yarn.log-aggregation.retain-secondsname>
		<value>18144000value>
	property>
	<property>
		<name>yarn.log-aggregation.retain-check-interval-secondsname>
		<value>86400value>
	property>
	
	<property>
        <name>yarn.app.mapreduce.am.resource.mbname>
        <value>1024value>
	property>
configuration>

workers

node01
node02
node03

8.5.3 创建数据和临时文件夹

mkdir -p /export/services/hadoop-3.1.1/datas/tmp
mkdir -p /export/services/hadoop-3.1.1/datas/dfs/nn/snn/edits
mkdir -p /export/services/hadoop-3.1.1/datas/namenode/namenodedatas
mkdir -p /export/services/hadoop-3.1.1/datas/datanode/datanodeDatas
mkdir -p /export/services/hadoop-3.1.1/datas/dfs/nn/edits
mkdir -p /export/services/hadoop-3.1.1/datas/dfs/snn/name
mkdir -p /export/services/hadoop-3.1.1/datas/jobhsitory/intermediateDoneDatas
mkdir -p /export/services/hadoop-3.1.1/datas/jobhsitory/DoneDatas
mkdir -p /export/services/hadoop-3.1.1/datas/nodemanager/nodemanagerDatas
mkdir -p /export/services/hadoop-3.1.1/datas/nodemanager/nodemanagerLogs
mkdir -p /export/services/hadoop-3.1.1/datas/remoteAppLog/remoteAppLogs

8.5.4 分发安装包到其它机器

cd /export/services
scp -r hadoop-3.1.1/ node02:$PWD
scp -r hadoop-3.1.1/ node03:$PWD

8.5.5 在每个节点配置环境变量

vi /etc/profile

export HADOOP_HOME=/export/services/hadoop-3.1.1/
export PATH=:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

8.5.6 格式化HDFS

为什么要格式化HDFS
- HDFS需要一个格式化的过程来创建存放元数据(image, editlog)的目录

bin/hdfs namenode -format

8.5.7 启动集群

注意：启动集群前，一定要启动zookeeper
zookeeper启动命令：/export/services/zookeeper-3.4.9/bin/zkServer.sh start

# 会登录进所有的worker启动相关进行, 也可以手动进行, 但是没必要
/export/services/hadoop-3.1.1/sbin/start-dfs.sh
/export/services/hadoop-3.1.1/sbin/start-yarn.sh
mapred --daemon start historyserver

执行结果：

此时便可以通过如下三个URL访问Hadoop了

HDFS: http://192.168.188.100:50070/dfshealth.html#tab-overview

Yarn: http://192.168.188.100:8088/cluster

报错：ERROR: Attempting to operate on hdfs namenode as root \n ERROR: but there is no HDFS_NAMENODE_USER defined. Aborting operation.
解决：设置hadoop-env.sh

export HDFS_NAMENODE_USER="root"
export HDFS_DATANODE_USER="root"
export HDFS_SECONDARYNAMENODE_USER="root"
export YARN_RESOURCEMANAGER_USER="root"
export YARN_NODEMANAGER_USER="root"

修改完后，向以前一样分发到其他两台机器

8.5.8 测试使用

创建测试文件，并加入到根目录下

查看控制台：

成功！撒花~~~

8.5.9 正常关闭集群(附加)

很重要，不然启动虚拟机都很难，会有各种怪事情出现！谨慎

node01执行/export/services/hadoop-3.1.1/sbin/stop-yarn.sh
node01执行/export/services/hadoop-3.1.1/sbin/stop-dfs.sh
三台机器都要执行/export/services/zookeeper-3.4.9/bin/zkServer.sh stop
shutdown -h now 关机睡觉！

下一篇:大数据学习系列：Hadoop3.0苦命学习（二）

你可能感兴趣的:(大数据栏目,hadoop,大数据,分布式,java)

Three.js学习笔记癫狂de痴梦前端 javascript 学习前端
1.three.js的引入进入官网Three.js–JavaScript3DLibrary，下载文件解压文件，复制three.js-master\build\three.min.js文件在项目中，引入该文件。2.一个简单threeJs程序（1）创建场景constscene=newTHREE.Scene();（2）创建物体constgeomtry=newTHREE.BoxGeometry(1,1,1
jwt相关问题及应用 2501_90243308 hive hadoop 数据仓库
接收方生成签名的时候必须使用跟JWT发送方相同的密钥六，JWT在spa项目中的使用================项目中JwtFilter类packagecom.zking.vue.util;importjava.io.IOException;importjava.util.regex.Matcher;importjava.util.regex.Pattern;importjavax.servle
Linux系统：第十章：服务器环境搭建 2501_90243308 服务器 linux 运维
JAVA_HOME=/opt/jdk1.8.0_152PATH=JAVAHOME/bin:JAVA_HOME/bin:JAVAHOME/bin:PATHexportJAVA_HOMEPATH然后保存退出：按Esc+：wq执行当前连接刚刚配置的脚本文件使配置文件生效：source/etc/profile或者reboot重启查看jdk版本：java-versionjavaversion“1.8.0_1
Java 不可变集合全面解析吉安. 开发语言 java
在Java编程中，不可变集合是一种特殊类型的集合，一旦创建，其内容就不能被修改。这种特性使得不可变集合在某些场景下具有独特的优势。创建不可变集合的应用场景数据不可修改的场景：当某个数据不应该被修改时，将其防御性地拷贝到不可变集合中是一种很好的实践。例如，一些配置信息、常量数据等，将它们放在不可变集合中，可以确保在程序运行过程中其内容不会被意外修改。安全调用不可信库：当集合对象需要被不可信的库调用时
Java配置文件从XML到Annotation完美转变 xiaoyustudiowww java
首先Java配置XML文件光定义文件DTD（DocumentTypeDefinition）或者XSD（XMLSchemaDefinition）就很麻烦，解析XML虽然很规则但是解析XML的代码复杂，而Annotation很方便。其次XML不是程序代码，而Java中Annotation是程序代码继而非常灵活简洁。
Flink (十二) ：Table API & SQL (一) 概览 Leven199527 Flink flink sql 大数据
ApacheFlink有两种关系型API来做流批统一处理：TableAPI和SQL。TableAPI是用于Scala和Java语言的查询API，它可以用一种非常直观的方式来组合使用选取、过滤、join等关系型算子。FlinkSQL是基于ApacheCalcite来实现的标准SQL。无论输入是连续的（流式）还是有界的（批处理），在两个接口中指定的查询都具有相同的语义，并指定相同的结果。TableAP
Java力扣题解：169 多数元素——投票法早起之王 leetcode leetcode
题目给定一个大小为n的数组，找到其中的多数元素。多数元素是指在数组中出现次数大于⌊n/2⌋的元素。你可以假设数组是非空的，并且给定的数组总是存在多数元素。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/majority-element著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。分析这里的投票法，是以第一个元素为基准数，票
Solon Cloud Gateway 开发：Helloword 组合缺一 Solon Java Framework gateway java solon
SolonCloudGateway，是一个可Java编程的分布式接口网关（或，代理网关）。有没有注册与发布服务。都可以用。不管是php或者node.js或得java，只要是http服务。也都可互通。下面，演示给一个服务（比如：https://www.baidu.com）配置代理网关呢？1、新建个空的solon-lib项目，添加maven依赖：生成空的solon-lib项目https://solon
Python知识点：基于Python工具和技术，如何使用Truffle进行智能合约开发与部署杰哥在此 Python系列 python 智能合约开发语言编程面试
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用Truffle与Python进行智能合约开发与部署Truffle是一个强大的开发框架，它为以太坊智能合约的开发、测试和部署提供了一整套工具。虽然Truffle主要使用JavaScript和Solidity，但是它也可以与Python工具和技术配合使用，以实现更灵活的开发流程。
LeetCode 21. 合并两个有序链表链表合并 Java实现 Lentr0py LeetCode 算法题 leetcode 链表 java 算法数据结构
21.合并两个有序链表21.合并两个有序链表题目来源题目分析题目难度题目标签题目限制解题思路思路：核心算法步骤迭代法代码实现代码解读性能分析复杂度结果测试用例扩展讨论优化写法其他实现总结21.合并两个有序链表题目来源21.合并两个有序链表题目分析将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。题目难度难度：简单题目标签标签：链表题目限制两个链表的节点数目
力扣：69. x 的平方根题解（Java） HOOHV 力扣题解
题目地址：x的平方根题目描述：实现intsqrt(intx)函数。计算并返回x的平方根，其中x是非负整数。由于返回类型是整数，结果只保留整数的部分，小数部分将被舍去。示例1:输入:4输出:2示例2:输入:8输出:2说明:8的平方根是2.82842..., 由于返回类型是整数，小数部分将被舍去。解题思路：没什么好说的，调用函数，然后强制转换成int返回就行了。……其实是要手动开平方，用到公式(x+a
redis原理小哲会嘿魔法 redis 数据库缓存
文章目录redis客户端-认识RESP持久化持久化具体实现1.RDB(RedisDataBase)2.AOF(AppendOnlyFile)事务相关命令主从复制拓扑结构同步过程部分复制实时复制哨兵（Sentinel）哨兵选取主节点流程集群数据分片主节点宕机集群扩容缓存缓存更新缓存预热、缓存穿透、缓存雪崩、缓存击穿分布式锁过期时间校验IdLua脚本watchdog（看门狗）Redlock算法redi
java.sql.date 字符串,字符串到java.sql.Date 高度不可替代性 java.sql.date 字符串
Irealizethishasbeenaskedalot.Ididactuallylook.I'vespenthourslookingaroundandtryingtofigurethisout.I'msupposedtobemakingaprogramthatstoreswhatamountstoalistofappointmentsinadatabase,withadescription,da
使用Kotlin编写一个Http服务器后端kotlinhttp
首发于Enaium的个人博客引言在本文中，我们将使用Kotlin编写一个简单的HTTP服务器。我们将使用Java的ServerSocket类来实现这个服务器。我们将创建一个简单的服务器，它将监听端口8000，并在接收到请求时返回一个简单的响应。Http的格式HTTP请求和响应都是文本格式的。HTTP请求由请求行、请求头和请求体组成。HTTP响应由状态行、响应头和响应体组成。具体可以到MDN查看。代
JavaScript常用的一些代码段东锋1.3 javascript javascript 开发语言 ecmascript
带有重复项使用递归。对于给定字符串中的每个字母，为字母创建字谜。使用map（）将字母与每部分字谜组合，然后使用reduce（）将所有字谜组合到一个数组中，最基本情况是字符串长度等于2或1。constanagrams=str=>{if(str.lengthacc.concat(anagrams(str.slice(0,i)+str.slice(i+1)).map(val=>letter+val)),
ZXing库 -- 生成二维码蓝田～ python 开发语言
引言二维码（QRCode）因其高密度的数据存储能力和易于扫描的特性，在现代社会中得到了广泛应用。ZXing是一个开源的二维码生成与读取库，它支持多种编程语言，包括Java。本指南将详细介绍如何在Java项目中使用ZXing库来生成带有透明背景的二维码。准备ZXing库com.google.zxingcore3.4.1com.google.zxingjavase3.4.1生成二维码编写代码packa
日常小tip_Bat命令运行Java程序蓝田～小tips java 开发语言
批处理命令介绍文章目录介绍常用语法bat命令运行一个简单的Java程序介绍批处理命令一般是一个文本文件，文件的每一行命令都会在DOS中执行。一般用来处理需要重复性执行的命令。常用语法echo:表示显示此命令后的字符echooff:表示不显示此命令后的命令行本身的字符@:与echooff类似，但是这条命令加在命令行之前，表示不显示这一行的命令行字符call:调用另外一个批处理文件pause:暂停当前
适合画地图的js库对比整理，Leaflet，Google Maps，Mapbox GL JS，OpenLayers，Cesium，D3.js等对应官方网站、Github项目地址、特点、使用场景及应用飞火流星02027 前台地图 GIS javascript 地图库 Leaflet D3.js Mapbox GL JS Google Maps OpenLayers
摘要适合画地图的js库对比整理，Leaflet，GoogleMapsJavaScriptAPI，MapboxGLJS，OpenLayers，Cesium，D3.js及对应官方网站、Github项目地址、特点、使用场景地图库对比整理明细表说明维度库名Github项目特点使用场景LeafletLeaflet/Leaflet轻量级、易于使用、功能丰富。支持各种地图服务（如OpenStreetMap、Ma
python json 用法云连山 python python json
JSON简介JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式。它基于JavaScript的一个子集，易于人阅读和编写，同时也易于机器解析和生成。在Python中，使用json模块来处理JSON数据。JSON支持的数据类型主要有对象（在Python中类似于字典）、数组（在Python中类似于列表）、字符串、数字、布尔值和null。将Python对象转换为JSON
禁止使用Date类的替代办法 Y_FQY java
为什么现在连Date类都不建议使用了？一、有什么问题吗java.util.Date？java.util.Date（Date从现在开始）是一个糟糕的类型，这解释了为什么它的大部分内容在Java1.1中被弃用（但不幸的是仍在使用）。设计缺陷包括：它的名称具有误导性：它并不代表一个日期，而是代表时间的一个瞬间。所以它应该被称为Instant——正如它的java.time等价物一样。它是非最终的：这鼓励了
【Redis】Redis入门以及什么是分布式系统{Redis引入+分布式系统介绍} 阿猿收手吧！ #Redis redis 数据库缓存
文章目录介绍redis的引入分布式系统单机架构应用服务和数据库服务分离【负载均衡】引入更多的应用服务器节点单机架构分布式是什么数据库分离和负载均衡理解负载均衡数据库读写分离引入缓存数据库分库分表引入微服务介绍Theopensource,in-memorydatastoreusedbymillionsofdevelopersasadatabases，cache,streamingengine,and
浅谈 redis BigDeng_2014 工作 redis 数据库 java
redis特点：单进程多线程。主线程只有一个，还有两个副线程，用于文件和IO处理。可以集群部署，数据在各个机器上都有备份，挂了一台机器，可以从其他机器上找到数据。集群带来主从节点机制，一般至少需要3个节点来选举出主节点，也可以指定主节点。主从同步问题，会导致数据不一致。保证了分布式P和可用性A，牺牲了一致性C，可以保证最终一致性。比如数据恢复。把数据存放到内存，从内存查找数据比较快一些。有key-
2024.3.26 腾讯魔方工作室—golang后台开发面经 2301_79125642 java
题解|#将两个SELECT语句结合起来（一）#selectprod_id,quantityfromOrderItemswherequanti2024.3.26腾讯魔方工作室—golang后台开发面经全程拷打，深挖项目，几乎不问八股，有些问题想不太清楚了，只是凭着模糊记忆把大体问题写下。做了三个项目题解|#求int型正整数在内存中存储时1的个数#importjava.util.Scanner;//注
java.sql.Date 弃用分析与替代方案蓝田～ java microsoft
引言java.sql.Date是Java标准库中的一个类，它继承自java.util.Date，主要用于在Java应用程序与数据库之间进行日期数据的传输。然而，随着Java语言的发展，java.sql.Date以及其父类java.util.Date逐渐被认为存在设计缺陷，并被新的日期时间API所替代。本文将对java.sql.Date的启用原因进行分析，并探讨其弃用原因及替代方案。启用原因分析SQ
MyBatis 框架简介天之涯上上 mybatis tomcat java
MyBatis框架简介MyBatis是一个优秀的Java持久层框架，它主要用于简化应用程序与数据库之间的交互。通过MyBatis，开发者可以直接编写SQL语句或使用XML映射文件来操作数据库，同时保持代码的灵活性和高效性。MyBatis以其易用性、灵活性和对SQL的强大支持而闻名，尤其适用于复杂查询和高度定制化的数据库操作场景。MyBatis的主要功能和特点1.持久化操作MyBatis通过将Jav
JAVA开发中 MyBatis XML 映射文件的作用天之涯上上 java mybatis xml
MyBatisXML映射文件（通常是以.xml结尾的文件，例如UserMapper.xml）是MyBatis框架的重要组成部分，主要用于定义SQL语句、结果映射关系以及参数绑定。它的作用是将Java方法与SQL语句关联起来，实现持久化操作（如查询、插入、更新和删除）。以下是关于MyBatisXML映射文件的详细说明：1.XML映射文件的作用1.1定义SQL语句MyBatis的核心功能是操作数据库，
JAVA开发在 Spring Boot 中集成 Swagger 天之涯上上 java spring boot 开发语言
Swagger是一个广泛使用的API文档生成工具，可以帮助你自动生成和维护RESTfulAPI的文档。在不同的框架中集成Swagger通常需要添加相应的依赖项。以下是几种常见Java框架（如SpringBoot）中集成Swagger的依赖配置。在SpringBoot中集成SwaggerSpringBoot结合Swagger可以通过springfox-swagger2和springfox-swagg
华为OD机试2024年E卷-分苹果[100分]（ Java | Python3 | C++ | C语言 | JsNode | Go ）实现100%通过率梅花C 华为OD题库华为od
题目描述A、B两个人把苹果分为两堆，A希望按照他的计算规则等分苹果Q，他的计算规则是按照二进制加法计算，并且不计算进位12+5=9(1100+0101=9)，B的计算规则是十进制加法，包括正常进位，B希望在满足A的情况下获取苹果重量最多。输入苹果的数量和每个苹果重量，输出满足A的情况下B获取的苹果总重量。如果无法满足A的要求，输出-1。数据范围1<=总苹果数量<=200001<=每个苹果重量<=1
JavaFX 实现 Loading 效果的组件与案例详解 J老熊 java 服务器开发语言后端面试系统架构软件工程
JavaFX中的Loading组件概述JavaFX提供了两个用于显示任务进度的核心组件：ProgressIndicator：以圆形动画的形式展示任务进度，适用于未定义进度的任务。ProgressBar：以水平条的形式展示任务进度，适用于可以量化进度的任务。这两个组件可直接绑定到后台任务的progress属性，实时更新界面。1.ProgressBar的常见方法ProgressBar是以水平条的形式显
使用IDEA创建一个SpringBoot项目 web13293720476 面试学习路线阿里巴巴 spring boot intellij-idea java 服务器 linux
文章目录一、SpringBoot是什么？二、使用idea创建SpringBoot项目1.使用idea的SpringInitiallizr创建项目2.初步配置3.编写简单代码及运行4.两个好玩的小东西总结一、SpringBoot是什么？Spring框架是Java平台上的一种开源应用框架，提供具有控制反转特性的容器。SpringBoot基于Spring4.0设计，不仅继承了Spring框架原有的优秀特
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户