MN979323

【教程】Hadoop完全分布式环境搭建全过程

文章目录

简介
内容&流程
- 一、模板虚拟机准备
- - 安装模板虚拟机
  - - 1，选择 - 自定义（高级）
    - 2，稍后安装操作系统（也可以选择直接安装，没有太大区别）
    - 3，虚拟机名称只作标识该虚拟机的作用，自定义即可
    - 4，处理器数量1，内核数量2
    - 5，内存4G & 硬盘50G
    - 6，自定义硬件
    - 7，开启此虚拟机，选择install centos 7（对应选项呈白色）
    - 8，语言 - 中文 - 简体中文
    - 9，日期和时间：亚洲-上海
    - 10，软件选择：只选择GNOME桌面
    - 11，安装位置：自动配置分区
    - 12，网络和主机名
    - - ☭问题1：打开网络后出现DNS1或者无法连接网络
    - 13，开始安装
    - 14，设置ROOT密码
    - 15，创建用户
  - 模板虚拟机环境准备
  - - 1，配置静态网络
    - 2，设置hostname
    - - ☭问题2：主机名变为bogon如何解决？
    - 3，SSH免密登录
    - 4，安装工具包
    - - ☭问题3：报错14: curl#6 - “Could not resolve host: mirrorlist.centos.org；未知的错误”
    - 5，关闭防火墙，并设置关闭防火墙开机自启
    - 6，修改/etc/sudoers文件，使hadoop用户（普通用户）具有 root 权限，方便后期加 sudo 执行 root 权限的命令
    - 7，在/opt 目录下创建 module、software 文件夹
    - 8，卸载虚拟机自带JDK并重启虚拟机
- 二、克隆虚拟机准备
- - 1，修改克隆机 IP
  - 2，修改克隆机主机名
  - 3，修改/etc/hosts文件
  - 4，重启虚拟机
  - 5，修改 windows 的主机映射文件
  - 6，在hadoop102上安装JDK
  - - - ☭问题4：执行 source /etc/profile命令时，报错：bash: ＃: 未找到命令
  - 7，在hadoop102安装Hadoop
- 三、完全分布式环境部署
- - 1，本地测试
  - 2，编写集群分发脚本 xsync
  - 3，ssh免密登录
  - 4，集群配置
  - 5，群起集群
  - 6，配置历史服务器
  - 7，配置日志的聚集
  - 8，编写 Hadoop 集群常用脚本
  - 9，时间同步
- 四、安装ZooKeeper、HBase、MAVEN和IDEA
- - ZooKeeper完全分布式部署
  - - 1，解压安装
    - 2，配置服务器编号
    - 3，配置 zoo.cfg 文件
    - - ☭问题5：启动ZooKeeper报错 mkdir: 无法创建目录".": 权限不够？
      - ☭问题6：Zookeeper启动显示成功，zkServer.sh status报错？
    - 4，集群操作
  - HBase安装
  - - 1，Zookeeper 正常部署
    - 2，Hadoop 正常部署
    - 3，HBase 的解压
    - 4，HBase 的配置文件
    - - ☭问题7：HBase启动警告：Java HotSpot™ 64-Bit Server VM warning
    - 5，HBase 远程发送到其他集群
    - 6，HBase 服务的启动
    - - ☭问题8：HBase启动报错错误：找不到或无法加载主类 org.jruby.Main
  - 安装MAVEN & IDEA
  - - 1，解压安装
    - 2，设置环境变量
    - 3，测试 MAVEN
    - 4，修改MAVEN配置文件，使用阿里的镜像地址
    - 5，运行IDEA
参考资料
资源分享

简介

保姆级入门教程：图片讲解 + 各种问题解决方案

集群服务器：hadoop102、hadoop103和hadoop104

虚拟机版本：CentOS7-1804

资源分享处（文章最后）提供CentOS7和Hadoop各组件压缩包（也可以自行下载，要注意版本兼容的问题），有需要自取~

内容&流程

1，模板虚拟机准备
2，克隆三台虚拟机，作为完全分布式集群
3， Hadoop完全分布式环境搭建
4， ZooKeeper & HBase & Maven & IDEA安装

一、模板虚拟机准备

安装模板虚拟机

注：下方未出现的步骤，选择默认选项即可

1，选择 - 自定义（高级）

2，稍后安装操作系统（也可以选择直接安装，没有太大区别）

3，虚拟机名称只作标识该虚拟机的作用，自定义即可

4，处理器数量1，内核数量2

5，内存4G & 硬盘50G

（此虚拟机只为演示Hadoop完全分布式环境搭建过程所用，4G内存基本够用）

硬盘50G
（安装内容包含JDK、Hadoop、ZooKeeper、HBase、Maven和IDEA，50G够用）

6，自定义硬件

6.1 选择ISO映像文件

选择稍后安装的要在这一步选择自定义硬件，添加ISO映像文件

6.2 USB兼容性 - USB 3.1

7，开启此虚拟机，选择install centos 7（对应选项呈白色）

8，语言 - 中文 - 简体中文

（在操作体验上，与选择英语差别不大，建议英语不太好的童靴选择中文）

进入安装信息摘要界面

9，日期和时间：亚洲-上海

10，软件选择：只选择GNOME桌面

11，安装位置：自动配置分区

选择自动配置分区即可
（若想要手动分区，则点击我要配置分区 - 完成，就会出现手动分区的界面）

12，网络和主机名

12.1 选择配置

12.2 查看个人虚拟机的相关信息

虚拟机 - 编辑选项卡 - 虚拟网络编辑器
选择NAT模式
NAT设置 - 查看子网掩码和网关
DHCP设置 - 查看IP地址范围
- 之后在配置静态IP地址时，所有的IP地址都必须在这个范围之内
回到配置界面 - 选择IPv4配置 - 点击 Add
- 根据前面的步骤，地址填IP地址范围内的地址，子网掩码和网关照填即可
- 附加DNS服务器：填入与网关IP相同的地址
点击保存 - 回到配置界面 - 打开网络

☭问题1：打开网络后出现DNS1或者无法连接网络

出现DNS1：检查网关地址是否正确
无法连接网络：检查IP地址是否在起始和终止的IP地址范围之内

点击完成

13，开始安装

将出现以下界面：

14，设置ROOT密码

建议密码不要太复杂

15，创建用户

创建一个普通用户，名称可自定义（我创建的用户名称是hadoop，之后用此名称指代普通用户）

目的： 在搭建项目的过程中，所有的项目有关的操作都由普通用户来执行，以此与超级用户（root用户）作区别，来维护系统的安全性（防止一些涉及到系统内核的操作被执行）。

建议密码不要太复杂

模板虚拟机环境准备

1，配置静态网络

Q：为什么使用静态IP地址？
A：在使用虚拟机的时候，默认情况下使用的DHCP协议分配的动态IP地址，使得每次打开虚拟机后当前的IP地址都会发生变化，这样不方便管理。为了能够给当前虚拟机设置一个静态IP地址，方便后期使用XShell连接工具进行连接，以及配置各种服务。所以，我们需要为虚拟机设置一个静态IP地址。

1.1 打开终端，查看网卡名称 - 我的网卡名称为ens33，如下图所示

[root@bogon ~]$ ip addr

1.2 修改网卡配置文件（记得后面要改成自己的网卡名称）

[root@bogon ~]$ vi /etc/sysconfig/network-scripts/ifcfg-ens33

修改以下选项

BOOTPROTO='dhcp' -> 'static'
ONBOOT='no' -> 'yes'

如果在前面安装过程中，设置 网络和主机名 没有出错，那下列选项应该没有问题

IPADDR='要设置的IP地址'
PREFIX='子网掩码'
GATEWAY='网关IP'
DNS1='网关IP'

1.3 重启网络

[root@bogon ~]$ service network restart

2，设置hostname

设置主机名很重要，我设置的模板机的主机名为hadoop100，之后集群服务器中的主机名为hadoop102、hadoop103和hadoop104

下面的命令按自己的主机名来

[root@bogon ~]$ hostnamectl set-hostname 主机名

例如：hostnamectl set-hostname hadoop100

2.1 查看hostname

[root@bogon ~]$ cat /etc/hostname
hadoop100

2.2 编辑hosts文件

目的： 修改/etc/hosts 文件，该文件主要用于映射 IP 地址和域名之间的连接

[root@bogon ~]$ vi /etc/hosts

在第二行添加：原本第二行如果有内容删除即可；
之后保存退出

IP地址 主机名

例如：
我设置的IP地址为xxx.xxx.xxx.130，那么我要添加的内容就是
xxx.xxx.xxx.130 hadoop100

☭问题2：主机名变为bogon如何解决？

# 执行su命令
[root@bogon ~]$ su
[root@localhost ~]$

3，SSH免密登录

# hadoop 普通用户
[root@localhost ~]$ su hadoop

# 第一次配置免密登录，执行下面这个命令后点三次回车即可
[hadoop@localhost root]$ ssh-keygen
[hadoop@localhost root]$ ssh-copy-id localhost
[hadoop@localhost root]$ ssh localhost
Last login: Web Feb 8 21:43:26 2023
[hadoop@localhost ~]$

4，安装工具包

[root@localhost ~]$ yum install -y epel-release
...
已安装：
 epel-release.noarch 0:7-11

完毕！

[root@localhost ~]$ yum install -y net-tools
[root@localhost ~]$ yum install -y vim

☭问题3：报错14: curl#6 - “Could not resolve host: mirrorlist.centos.org；未知的错误”

CentOS7下报错14: curl#6 - “Could not resolve host: mirrorlist.centos.org；未知的错误”-解决方法

5，关闭防火墙，并设置关闭防火墙开机自启

[root@localhost ~]$ systemctl stop firewalld
[root@localhost ~]$ systemctl disable firewalld.service
Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.

# 查看防火墙是否已关闭
[root@localhost ~]$ systemctl list-unit-files |grep firewalld
firewalld.service disabled

6，修改/etc/sudoers文件，使hadoop用户（普通用户）具有 root 权限，方便后期加 sudo 执行 root 权限的命令

[root@localhost ~]$ vim /etc/sudoers

在%wheel 这行下面添加一行，其他为文件本身内容，不要改动

## Allow root to run any commands anywhere
root ALL=(ALL) ALL
## Allows people in group wheel to run all commands
%wheel ALL=(ALL) ALL
hadoop ALL=(ALL) NOPASSWD:ALL

7，在/opt 目录下创建 module、software 文件夹

7.1 module文件夹存放解压后的文件，software文件夹存放待解压的压缩包

[root@localhost ~]$ mkdir /opt/module /opt/software

7.2 修改两个目录的所属组和所有者均为hadoop用户

[root@localhost ~]$ chown -R hadoop:hadoop /opt/module
[root@localhost ~]$ chown -R hadoop:hadoop /opt/software

7.3 查看 module、software 文件夹的所有者和所属组

[root@localhost ~]$ cd /opt/
[root@localhost opt]$ ll
总用量 0
drwxr-xr-x. 2 hadoop hadoop 6 2月 8 21:53 module
drwxr-xr-x. 2 root root     6 9月 7 2017 rh
drwxr-xr-x. 2 hadoop hadoop 6 2月 8 12:53 software

8，卸载虚拟机自带JDK并重启虚拟机

[root@localhost opt]$ rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps
[root@localhost opt]$ reboot

8.1 查看JDK版本（看是否卸载干净）

[root@hadoop100 ~]$ java -version
bash: java: 未找到命令...

二、克隆虚拟机准备

使用VMware自带的克隆功能，利用模板虚拟机克隆三台虚拟机：

主机名分别为hadoop102、hadoop103和hadoop104

IP地址为xxx.xxx.xxx.132、xxx.xxx.xxx.133和xxx.xxx.xxx.134（根据自己虚拟机的IP地址范围配置，下面有具体配置过程）

注意：克隆时，要先关闭hadoop100

1，修改克隆机 IP

以下过程以hadoop102为例，三台虚拟机都需要做

1.1 修改网卡配置文件（记得后面要改成自己的网卡名称）

[root@hadoop100 ~]$ vi /etc/sysconfig/network-scripts/ifcfg-ens33

修改以下选项
- 附：Linux中为网卡生成UUID

UUID='原来的UUID' -> '新生成的UUID'
IPADDR='原来的IP地址' -> '要设置的IP地址'

1.2 重启网络

[root@hadoop100 ~]$ service network restart

2，修改克隆机主机名

以下过程以hadoop102为例，三台虚拟机都需要做

[root@hadoop100 ~]$ vim /etc/hostname
hadoop102

3，修改/etc/hosts文件

以下过程以hadoop102为例，三台虚拟机都需要做

[root@hadoop100 ~]$ vim /etc/hosts

3.1 添加如下内容

依然是IP地址要修改成你自己的：
尤其是hadoop102~104，对应的IP地址为你要设置的IP

192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108

4，重启虚拟机

以下过程以hadoop102为例，三台虚拟机都需要做

[root@hadoop100 ~]$ reboot

4.1 重启之后，打开终端发现主机名已经修改成功

[root@hadoop102 ~]$

5，修改 windows 的主机映射文件

5.1 如果操作系统是window7，可以直接修改

进入C:\Windows\System32\drivers\etc 路径
打开hosts 文件并添加如下内容，然后保存

192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108

5.2 如果操作系统是window10，先拷贝出来，修改保存以后，再覆盖即可

进入C:\Windows\System32\drivers\etc 路径
拷贝hosts 文件到桌面
打开桌面 hosts 文件并添加同上内容
将桌面 hosts 文件覆盖 C:\Windows\System32\drivers\etc 路径 hosts 文件

修改完毕后，就可以在windows环境下使用xshell连接虚拟机了，操作会方便很多哦~
附：XShell免费版的安装配置教程以及使用教程（超级详细、保姆级）

6，在hadoop102上安装JDK

6.1 首先确保虚拟机自带JDK卸载干净

[root@hadoop102 ~]$ java -version
bash: java: 未找到命令...

6.2 解压JDK到/opt/module

提示1：xshell中可以使用rz命令将本地文件上传至虚拟机，或者建立共享文件夹也有同样效果。

提示2：文章末尾提供JDK8等各组件的安装包，需要自取~

进入/opt/software文件夹，查看压缩包名称

[root@hadoop102 ~]$ cd /opt/software
[root@hadoop102 software]$ ls

解压JDK压缩包

[root@hadoop102 software]$ su hadoop
[hadoop@hadoop102 software]$ sudo tar -zxvf jdk-8u211-linux-x64.tar.gz -C /opt/module

6.3 修改JDK安装包名称

[hadoop@hadoop102 software]$ cd ../module
[hadoop@hadoop102 module]$ ls
jdk1.8.0_211

[hadoop@hadoop102 module]$ mv jdk1.8.0_211 jdk
[hadoop@hadoop102 module]$ ls
jdk

6.4 配置 JDK 环境变量

[hadoop@hadoop102 module]$ sudo vim /etc/profile.d/my_env.sh

添加以下内容：

#JAVA_HOME
export JAVA_HOME=/opt/module/jdk
export PATH=$PATH:$JAVA_HOME/bin

刷新shell环境，让环境变量生效

[hadoop@hadoop102 module]$ source /etc/profile

查看JDK版本信息

[hadoop@hadoop102 module]$ java -version

☭问题4：执行 source /etc/profile命令时，报错：bash: ＃: 未找到命令

首先再仔细检查一下 /etc/profile.d/my_env.sh 文件，尤其是注释前面的 # 有没有省略，以及HOME目录有没有配错。

7，在hadoop102安装Hadoop

7.1 进入/opt/software文件夹，解压Hadoop到/opt/module

[hadoop@hadoop102 software]$ sudo tar -zxvf hadoop-2.6.0-cdh5.14.2.tar.gz -C /opt/module

7.2 修改Hadoop安装包名称

[hadoop@hadoop102 module]$ ls
hadoop-2.6.0-cdh5.14.2 jdk

[hadoop@hadoop102 module]$ mv hadoop-2.6.0-cdh5.14.2 hadoop
[hadoop@hadoop102 module]$ ls
hadoop jdk

# 确保hadoop用户具有操作module目录下文件的权限
[hadoop@hadoop102 module]$ cd ..
[hadoop@hadoop102 opt]$ chown -R hadoop:hadoop module

7.3 将 Hadoop 添加到环境变量

[hadoop@hadoop102 module]$ sudo vim /etc/profile.d/my_env.sh

添加以下内容：

#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

刷新shell环境，让环境变量生效

[hadoop@hadoop102 module]$ source /etc/profile

查看Hadoop版本信息

[hadoop@hadoop102 module]$ hadoop version

三、完全分布式环境部署

1，本地测试

里面有些步骤与后续内容相关，尽量不要跳过

#创建hello.txt文件，用来测试hadoop自带的wordcount程序
[hadoop@hadoop102 module]$ mkdir /hadoop/wcinput
[hadoop@hadoop102 module]$ cd /hadoop/wcinput
[hadoop@hadoop102 wcinput]$ vim hello.txt

1.1 在hello.txt文件中填入任意内容即可，举例：

hello world
hello java
I'm MOSS

1.2 运行wordcount程序

注：在$HADOOP_HOME/share/hadoop/mapreduce/目录下找对应jar包

[hadoop@hadoop102 hadoop]$ pwd
/opt/module/hadoop

[hadoop@hadoop102 hadoop]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.14.2.jar wordcount wcinput wcoutput
[hadoop@hadoop102 hadoop]$ cat wcoutput/part-r-00000

2，编写集群分发脚本 xsync

2.1 执行以下命令同步jdk和hadoop文件到hadoop103和hadoop104，顺便测试scp和rsync命令

注意执行各命令的服务器

[hadoop@hadoop102 hadoop]$ scp -r /opt/module/jdk hadoop@hadoop103:/opt/module

[hadoop@hadoop103 hadoop]$ scp -r hadoop@hadoop102:/opt/module/hadoop /opt/module/
[hadoop@hadoop103 hadoop]$ scp -r hadoop@hadoop102:/opt/module/* hadoop@hadoop104:/opt/module

# 在hadoop103上删除wcinput目录，执行rsync同步命令后，hadoop103上wcinput目录恢复
[hadoop@hadoop103 hadoop]$ rm -rf wcinput/
[hadoop@hadoop102 opt]$ rsync -av hadoop/ hadoop@hadoop103:/opt/module/hadoop/

2.2 编写xsync脚本

期望脚本在任何路径都能使用（脚本放在声明了全局环境变量的路径）：

[hadoop@hadoop102 opt]$ echo $PATH
[hadoop@hadoop102 opt]$ cd /home/hadoop
[hadoop@hadoop102 ~]$ mkdir bin

将/home/hadoop/bin目录添加到全局环境变量中

[hadoop@hadoop102 ~]$ sudo vim /etc/profile.d/my_env.sh

添加以下内容：

#XSYNC_HOME
export XSYNC_HOME=/home/hadoop
export PATH=$PATH:$XSYNC_HOME/bin

刷新shell环境，让环境变量生效

[hadoop@hadoop102 ~]$ source /etc/profile

# 查看发现全局环境变量中已有/home/hadoop/bin目录
[hadoop@hadoop102 ~]$ echo $PATH

在/home/hadoop/bin目录下编写xsync脚本

[hadoop@hadoop102 ~]$ cd bin
[hadoop@hadoop102 bin]$ vim xsync

在该文件中编写如下代码

#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
 echo Not Enough Arguement!
 exit;
fi
#2. 遍历集群所有机器
for host in hadoop102 hadoop103 hadoop104
do
 echo ==================== $host ====================
 #3. 遍历所有目录，挨个发送
 for file in $@
 do
 #4. 判断文件是否存在
 if [ -e $file ]
 then
 #5. 获取父目录
 pdir=$(cd -P $(dirname $file); pwd)
 #6. 获取当前文件的名称
 fname=$(basename $file)
 ssh $host "mkdir -p $pdir"
 rsync -av $pdir/$fname $host:$pdir
 else
 echo $file does not exists!
 fi
 done
done

2.3 修改脚本 xsync 具有执行权限

[hadoop@hadoop102 bin]$ chmod +x xsync

2.4 测试脚本

[hadoop@hadoop102 bin]$ xsync /home/hadoop/bin

2.5 同步环境变量配置
注意：如果用了 sudo，那么 xsync 一定要给它的路径补全。

[hadoop@hadoop102 ~]$ sudo ./bin/xsync /etc/profile.d/my_env.sh

2.6 让环境变量生效

[hadoop@hadoop103 bin]$ source /etc/profile
[hadoop@hadoop104 bin]$ source /etc/profile

3，ssh免密登录

3.1 生成公钥和私钥

[hadoop@hadoop102 ~]$ cd /home/hadoop/.ssh
[hadoop@hadoop102 .ssh]$ ssh-keygen -t rsa

3.2 将公钥拷贝到要免密登录的目标机器上

[hadoop@hadoop102 .ssh]$ ssh-copy-id hadoop102
[hadoop@hadoop102 .ssh]$ ssh-copy-id hadoop103
[hadoop@hadoop102 .ssh]$ ssh-copy-id hadoop104

注意：

还需要在 hadoop103 上采用 hadoop 账号配置一下无密登录到 hadoop102、hadoop103、 hadoop104 服务器上；

还需要在 hadoop104 上采用 hadoop 账号配置一下无密登录到 hadoop102、hadoop103、 hadoop104 服务器上；

还需要在 hadoop102 上采用 root 账号，配置一下无密登录到 hadoop102、hadoop103、hadoop104。

接下来就可以通过ssh 主机名命令免密登录到别的服务器了~
以下为测试：

[hadoop@hadoop102 .ssh]$ ssh hadoop103
Last login: Tue Feb 14 11:57:09 2023 from hadoop102

[hadoop@hadoop103 ~]$ pwd
/home/hadoop
[hadoop@hadoop103 ~]$ exit
登出
Connection to hadoop103 closed.
[hadoop@hadoop102 .ssh]$

4，集群配置

4.1 集群部署规划

元数据节点、资源管理器和从元数据节点分别安装在三台服务器上

数据节点和节点管理器在三台服务器上均安装

4.2 配置集群

核心配置文件配置 core-site.xml

[hadoop@hadoop102 .ssh]$ cd $HADOOP_HOME/etc/hadoop
[hadoop@hadoop102 hadoop]$ vim core-site.xml

core-site.xml修改内容如下：

注意这个hadoop数据存储目录哦，如果没有指定的话，hadoop会在HOME目录下生成一个tmp目录，现在我们指定了，就变成 /opt/module/hadoop/data目录。

所以如果在进行hadoop的格式化之前要删除的tmp目录和logs目录，就变成了data目录和logs目录了。

附：如何重新格式化Hadoop文件系统

<configuration>
    <!-- 指定 NameNode 的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop102:8020</value>
    </property>
    <!-- 指定 hadoop 数据的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/hadoop/data</value>
    </property>
    <!-- 配置 HDFS 网页登录使用的静态用户为 hadoop -->
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>hadoop</value>
    </property>
</configuration>

HDFS 配置文件-配置 hdfs-site.xml

[hadoop@hadoop102 hadoop]$ vim hdfs-site.xml

hdfs-site.xml修改内容如下：

<configuration>
    <!-- nn web 端访问地址-->
    <property>
        <name>dfs.namenode.http-address</name>
        <value>hadoop102:9870</value>
    </property>
    <!-- 2nn web 端访问地址-->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>hadoop104:9868</value>
    </property>
</configuration>

YARN 配置文件-配置 yarn-site.xml

[hadoop@hadoop102 hadoop]$ vim yarn-site.xml

yarn-site.xml修改内容如下：

<configuration>
    <!-- 指定 MR 走 shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <!-- 指定 ResourceManager 的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop103</value>
    </property>
    <!-- 环境变量的继承 -->
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CO
            NF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAP
            RED_HOME</value>
    </property>
</configuration>

MapReduce 配置文件-配置 mapred-site.xml

[hadoop@hadoop102 hadoop]$ vim mapred-site.xml

mapred-site.xml内容如下：

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <!-- 指定 MapReduce 程序运行在 Yarn 上 -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

4.3 在集群上分发配置好的 Hadoop 配置文件

[hadoop@hadoop102 hadoop]$ xsync /opt/module/hadoop/etc/hadoop/

4.4 去103 和 104上查看文件分发情况

[hadoop@hadoop103 ~]$ cat /opt/module/hadoop/etc/hadoop/core-site.xml
[hadoop@hadoop104 ~]$ cat /opt/module/hadoop/etc/hadoop/core-site.xml

5，群起集群

5.1 配置 slaves（hadoop3.0之后版本改为workers）

[hadoop@hadoop102 hadoop]$ vim /opt/module/hadoop/etc/hadoop/slaves

文件内容如下：（原本的内容要删除）

hadoop102
hadoop103
hadoop104

同步所有节点配置文件：

[hadoop@hadoop102 hadoop]$ xsync /opt/module/hadoop/etc

5.2 启动集群
注意：如果集群是第一次启动，需要在 hadoop102 节点格式化 NameNode

[hadoop@hadoop102 hadoop]$ hdfs namenode -format

启动HDFS：

[hadoop@hadoop102 hadoop]$ start-dfs.sh

在配置了 ResourceManager 的节点（hadoop103）启动 YARN：

[hadoop@hadoop103 hadoop]$ start-yarn.sh

6，配置历史服务器

目的： 为了查看程序的历史运行情况

Hadoop自带了一个历史服务器，可以通过历史服务器在web端查看已经运行完的Mapreduce作业记录，比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息

所以修改mapreduce的配置文件以配置历史服务器

6.1 配置 mapred-site.xml

[hadoop@hadoop102 hadoop]$ vim mapred-site.xml

在该文件里面增加如下配置：

    <!-- 历史服务器端地址 -->
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>hadoop102:10020</value>
    </property>
    <!-- 历史服务器 web 端地址 -->
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>hadoop102:19888</value>
    </property>

6.2 分发配置

[hadoop@hadoop102 hadoop]$ xsync $HADOOP_HOME/etc/hadoop/mapred-site.xml

6.3 在 hadoop102启动历史服务器

在hadoop2.0和hadoop3.0上，启动和终止历史服务器的命令有区别，以下为2.0版本
附：hadoop3.x集群：配置、启动历史服务（history server，端口19888）

[hadoop@hadoop102 hadoop]$ mr-jobhistory-daemon.sh start historyserver

6.4 查看历史服务器是否启动

[hadoop@hadoop102 hadoop]$ jps

7，配置日志的聚集

目的： 可以方便的查看到程序运行详情，方便开发调试（在102的HDFS上）

7.1 配置 yarn-site.xml

[hadoopu@hadoop102 hadoop]$ vim yarn-site.xml

在该文件里面增加如下配置

    <!-- 开启日志聚集功能 -->
    <property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
    </property>
    <!-- 设置日志聚集服务器地址 -->
    <property>
        <name>yarn.log.server.url</name>
        <value>http://hadoop102:19888/jobhistory/logs</value>
    </property>
    <!-- 设置日志保留时间为 7 天 -->
    <property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>604800</value>
    </property>

7.2 分发配置

[hadoop@hadoop102 hadoop]$ xsync $HADOOP_HOME/etc/hadoop/yarn-site.xml

7.3 关闭 NodeManager 、ResourceManager和 HistoryServer

[hadoop@hadoop103 hadoop]$ stop-yarn.sh
[hadoop@hadoop102 hadoop]$ mr-jobhistory-daemon.sh stop historyserver

7.4 启动 NodeManager 、ResourceManage 和 HistoryServer

[hadoop@hadoop103 hadoop]$ start-yarn.sh
[hadoop@hadoop102 hadoop]$ mr-jobhistory-daemon.sh start historyserver

7.5 测试

上传hello.txt文件

[hadoop@hadoop102 hadoop]$ pwd
/opt/module/hadoop
[hadoop@hadoop102 hadoop]$ hadoop fs -mkdir /input
[hadoop@hadoop102 hadoop]$ hadoop fs -put wcinput/hello.txt /input

执行 WordCount 程序

[hadoop@hadoop102 hadoop]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.14.2.jar wordcount /input /output

# 查看运行结果
[hadoop@hadoop102 hadoop]$ hadoop fs -text /out*/p*

7.6 查看日志

历史服务器地址：地址
历史任务列表
查看任务运行日志
运行日志详情

8，编写 Hadoop 集群常用脚本

8.1 Hadoop 集群启停脚本（包含 HDFS，Yarn，Historyserver）

[hadoop@hadoop102 ~]$ cd /home/hadoop/bin
[hadoop@hadoop102 bin]$ vim myhadoop.sh

编写myhadoop.sh脚本内容

#!/bin/bash
if [ $# -lt 1 ]
then
 echo "No Args Input..."
 exit ;
fi
case $1 in
"start")
 echo " =================== 启动 hadoop 集群 ==================="
 echo " --------------- 启动 hdfs ---------------"
 ssh hadoop102 "/opt/module/hadoop/sbin/start-dfs.sh"
 echo " --------------- 启动 yarn ---------------"
  ssh hadoop103 "/opt/module/hadoop/sbin/start-yarn.sh"
 echo " --------------- 启动 historyserver ---------------"
 ssh hadoop102 "/opt/module/hadoop/sbin/mr-jobhistory-daemon.sh start historyserver"
;;
"stop")
 echo " =================== 关闭 hadoop 集群 ==================="
 echo " --------------- 关闭 historyserver ---------------"
 ssh hadoop102 "/opt/module/hadoop/sbin/mr-jobhistory-daemon.sh stop historyserver"
 echo " --------------- 关闭 yarn ---------------"
 ssh hadoop103 "/opt/module/hadoop/sbin/stop-yarn.sh"
 echo " --------------- 关闭 hdfs ---------------"
 ssh hadoop102 "/opt/module/hadoop/sbin/stop-dfs.sh"
;;
*)
 echo "Input Args Error..."
;;
esac

保存后退出，然后赋予脚本执行权限

[hadoop@hadoop102 bin]$ chmod +x myhadoop.sh

8.2 查看三台服务器 Java 进程脚本

[hadoop@hadoop102 ~]$ cd /home/hadoop/bin
[hadoop@hadoop102 bin]$ vim jpsall

输入如下内容

#!/bin/bash
for host in hadoop102 hadoop103 hadoop104
do
 echo =============== $host ===============
 ssh $host jps
done

保存后退出，然后赋予脚本执行权限:

[hadoop@hadoop102 bin]$ chmod +x jpsall

8.3 分发/home/hadoop/bin 目录，保证自定义脚本在三台机器上都可以使用:

# 先确保一下文件所属
[hadoop@hadoop102 ~]$ chown -R hadoop:hadoop bin

# 分发bin目录
[hadoop@hadoop102 ~]$ xsync /home/hadoop/bin/

8.4 测试

[hadoop@hadoop102 ~]$ myhadoop.sh stop
[hadoop@hadoop102 ~]$ jpsall

9，时间同步

如果服务器在公网环境（能连接外网），可以不采用集群时间同步，因为服务器会定期和公网时间进行校准；

如果服务器在内网环境，必须要配置集群时间同步，否则时间久了，会产生时间偏差，导致集群执行任务时间不同步。

因为我没有配置，所以需要配置时间同步的童靴请自行搜索 Hadoop集群时间同步配置。

四、安装ZooKeeper、HBase、MAVEN和IDEA

ZooKeeper完全分布式部署

1，解压安装

1.1 解压 Zookeeper 安装包到/opt/module/目录下

[hadoop@hadoop102 software]$ tar -zxvf zookeeper-3.4.10.tar.gz -C /opt/module/

# 在/opt/module目录下修改ZK文件包名称
[hadoop@hadoop102 software]$ cd /opt/module
[hadoop@hadoop102 module]$ mv zookeeper-3.4.10 zookeeper
[hadoop@hadoop102 module]$ ls
hadoop jdk zookeeper

# 修改其所属为hadoop用户
[hadoop@hadoop102 module]$ sudo chown -R hadoop:hadoop zookeeper

1.2 同步/opt/module/zookeeper 目录内容到 hadoop103、hadoop104

[hadoop@hadoop102 module]$ xsync zookeeper/

2，配置服务器编号

2.1 在/opt/module/zookeeper/这个目录下创建 zkData

[hadoop@hadoop102 zookeeper]$ mkdir zkData

2.2 在/opt/module/zookeeper/zkData 目录下创建一个 myid 的文件

[hadoop@hadoop102 zkData]$ touch myid

添加 myid 文件，注意一定要在 linux 里面创建，在 notepad++里面很可能乱码

2.3 编辑 myid 文件

[hadoop@hadoop102 zkData]$ vim myid

在文件中添加与 server 对应的编号：

2.4 拷贝配置好的 zookeeper 到其他机器上

[hadoop@hadoop102 zkData]$ xsync myid

并分别在 hadoop103、hadoop104 上修改 myid 文件中内容为 3、4
注意：使用xsync分发文件会使目标服务器上的文件与本服务器文件完全一致。进行Hadoop完全分布式环境搭建的时候，如果分发的目录或文件中包含myid文件，一定记得修改目标服务器上的myid文件，否则可能导致zookeeper无法启动等问题。

3，配置 zoo.cfg 文件

3.1 重命名/opt/module/zookeeper/conf 这个目录下的 zoo_sample.cfg 为 zoo.cfg

[hadoop@hadoop102 conf]$ mv zoo_sample.cfg zoo.cfg

3.2 修改 zoo.cfg 文件

[hadoop@hadoop102 conf]$ vim zoo.cfg

修改数据存储路径配置：

dataDir=/opt/module/zookeeper/zkData

增加如下配置：

#######################cluster##########################
server.2=hadoop102:2888:3888
server.3=hadoop103:2888:3888
server.4=hadoop104:2888:3888

配置参数解读

server.A=B:C:D

A 是一个数字，表示这个是第几号服务器；集群模式下配置一个文件 myid，这个文件在 dataDir 目录下，这个文件里面有一个数据就是A 的值，Zookeeper 启动时读取此文件，拿到里面的数据与 zoo.cfg 里面的配置信息较从而判断到底是哪个 server；

B 是这个服务器的地址；

C 是这个服务器 Follower 与集群中的 Leader 服务器交换信息的端口；

D 是万一集群中的 Leader服务器挂了，需要一个端口来重新进行选举，选出一个新的 Leader，而这个端口就是用来执行选举时服务器相互通信的端口。

3.3 同步 zoo.cfg 配置文件

[hadoop@hadoop102 conf]$ xsync zoo.cfg

3.4 删除hadoop103和hadoop104上的多余文件

# hadoop103
[hadoop@hadoop103 conf]$ pwd
/opt/module/zookeeper/conf
[hadoop@hadoop103 conf]$ rm -rf zoo_sample.cfg

# hadoop104
[hadoop@hadoop104 conf]$ rm -rf zoo_sample.cfg

☭问题5：启动ZooKeeper报错 mkdir: 无法创建目录".": 权限不够？

注意：ZK有启动成功，只是在启动时返回这样一条报错信息，那么只需要把集群中的zoo_sample.cfg文件删除即可。

☭问题6：Zookeeper启动显示成功，zkServer.sh status报错？

附：Zookeeper启动显示成功，zkServer.sh status报错

补充一条：重新查看集群中各服务器的myid文件中的编号，是否与在zoo.cfg文件配置的服务器编号一致。

4，集群操作

4.1 将ZooKeeper目录所在路径添加到环境变量，方便全局调用命令

[hadoop@hadoop102 conf]$ sudo vim /etc/profile.d/my_env.sh
[hadoop@hadoop102 conf]$ source /etc/profile

添加以下内容：

#ZOOKEEPER_HOME
export ZOOKEEPER_HOME=/opt/module/zookeeper
export PATH=$PATH:$ZOOKEEPER_HOME/bin
export PATH=$PATH:$ZOOKEEPER_HOME/sbin

4.2 编写ZooKeeper启动脚本
注意：集群中全部服务器上的Zookeeper均启动成功，才能正常运行

[hadoop@hadoop102 conf]$ cd /home/hadoop/bin
[hadoop@hadoop102 bin]$ vim myzk.sh

编写myzk.sh脚本内容

#!/bin/bash
if [ $# -lt 1 ]
then
 echo "No Args Input..."
 exit ;
fi
case $1 in
"start")
 echo " =================== 启动 zookeeper ==================="
 echo " --------------- hadoop102 ---------------"
 ssh hadoop102 "/opt/module/zookeeper/bin/zkServer.sh start"
 echo " --------------- hadoop103 ---------------"
 ssh hadoop103 "/opt/module/zookeeper/bin/zkServer.sh start"
 echo " --------------- hadoop104 ---------------"
 ssh hadoop104 "/opt/module/zookeeper/bin/zkServer.sh start"
;;
"stop")
 echo " =================== 关闭 zookeeper ==================="
 echo " --------------- hadoop104 ---------------"
 ssh hadoop104 "/opt/module/zookeeper/bin/zkServer.sh stop"
 echo " --------------- hadoop103 ---------------"
 ssh hadoop103 "/opt/module/zookeeper/bin/zkServer.sh stop"
 echo " --------------- hadoop102 ---------------"
 ssh hadoop102 "/opt/module/zookeeper/bin/zkServer.sh stop"
;;
*)
 echo "Input Args Error..."
;;
esac

保存后退出，然后赋予脚本执行权限

[hadoop@hadoop102 bin]$ chmod +x myzk.sh

4.3 分发/home/hadoop/bin 目录，保证自定义脚本在三台机器上都可以使用

# 进入bin的上级目录/home/hadoop
[hadoop@hadoop102 bin]$ cd ..

# 先确保一下文件所属
[hadoop@hadoop102 ~]$ chown -R hadoop:hadoop bin

# 分发bin目录
[hadoop@hadoop102 ~]$ xsync bin/

4.4 运行ZooKeeper

[hadoop@hadoop102 ~]$ myzk.sh start

4.5 查看状态

[hadoop@hadoop102 zookeeper]$ zkServer.sh status
[hadoop@hadoop103 zookeeper]$ zkServer.sh status
[hadoop@hadoop104 zookeeper]$ zkServer.sh status

HBase安装

1，Zookeeper 正常部署

首先保证 Zookeeper 集群的正常部署，并启动之

# 启动过就不要再启动了
[hadoop@hadoop102 zookeeper]$ myzk.sh start

2，Hadoop 正常部署

Hadoop 集群的正常部署并启动

[hadoop@hadoop102 hadoop]$ myhadoop.sh start

3，HBase 的解压

3.1 解压 HBase 到指定目录

[hadoop@hadoop102 software]$ tar -zxvf hbase-1.2.0-cdh5.14.0.tar.gz -C /opt/module

3.2 修改文件包名称和所属

[hadoop@hadoop102 module]$ mv hbase* hbase
[hadoop@hadoop102 module]$ sudo chown -R hadoop:hadoop hbase

# 进入conf目录，之后需修改配置文件
[hadoop@hadoop102 module]$ cd hbase/conf
[hadoop@hadoop102 conf]$

4，HBase 的配置文件

4.1 修改 hbase-env.sh

修改内容如下：分别在27和128行左右

export JAVA_HOME=/opt/module/jdk
export HBASE_MANAGES_ZK=false

☭问题7：HBase启动警告：Java HotSpot™ 64-Bit Server VM warning

警告内容：
Java HotSpot™ 64-Bit Server VM warning: ignoring option PermSize=128m; support was removed in 8.0
Java HotSpot™ 64-Bit Server VM warning: ignoring option MaxPermSize=128m; support was removed in 8.0

解决方案：
hbase-env.sh文件中45行左右有注释说明下面两个export在JDK8+版本可以被安全地移除，注释掉即可

4.2 hbase-site.xml 修改内容

<configuration>
    <property> 
        <name>hbase.rootdir</name> 
        <value>hdfs://hadoop102:8020/hbase</value> 
    </property>
    <property> 
        <name>hbase.cluster.distributed</name>
        <value>true</value>
    </property>
    <!-- 0.98后的新变动，之前版本没有.port,默认端口为60000 -->
    <property>
        <name>hbase.master.port</name>
        <value>16000</value>
    </property>
    <property>
        <name>hbase.zookeeper.quorum</name>
        <value>hadoop102:2181,hadoop103:2181,hadoop104:2181</value>
    </property>
    <property> 
        <name>hbase.zookeeper.property.dataDir</name>
        <value>/opt/module/zookeeper/zkData</value>
    </property>
</configuration>

4.3 regionservers文件内容如下：原内容删去

regionservers文件列出了所有运行HRegionServer进程服务器，对该文件的配置与Hadoop中对slaves或者workers文件的配置相似，需要在文件的每一行指定一台服务器，当HBASE启动时会读取该文件，将文件指定的所有服务器启动HRegionServer进程，当HBASE停止的时候，也会同时停止他们。

因此，在启动hbase后，主服务器hadoop102将启动两个节点HMaster和HRegionServer，其余各服务器启动一个节点HRegionServer。

hadoop102
hadoop103
hadoop104

4.4 软连接 hadoop 配置文件到 hbase：

[hadoop@hadoop102 module]$ ln -s /opt/module/hadoop/etc/hadoop/core-site.xml /opt/module/hbase/conf/core-site.xml
[hadoop@hadoop102 module]$ ln -s /opt/module/hadoop/etc/hadoop/hdfs-site.xml /opt/module/hbase/conf/hdfs-site.xml

5，HBase 远程发送到其他集群

[hadoop@hadoop102 module]$ xsync hbase/

6，HBase 服务的启动

6.1 添加环境变量

[hadoop@hadoop102 module]$ sudo vim /etc/profile.d/my_env.sh
[hadoop@hadoop102 module]$ source /etc/profile

添加内容如下

#HBASE_HOME
export HBASE_HOME=/opt/module/hbase
export PATH=$PATH:$HBASE_HOME/bin

6.2 分发环境变量文件

[hadoop@hadoop102 module]$ sudo /home/hadoop/bin/xsync /etc/profile.d/my_env.sh

# 使文件在各服务器上生效
[hadoop@hadoop103 module]$ source /etc/profile
[hadoop@hadoop104 module]$ source /etc/profile

6.3 测试

[hadoop@hadoop102 module]$ start-hbase.sh
[hadoop@hadoop102 module]$ jpsall
[hadoop@hadoop102 module]$ hbase shell

☭问题8：HBase启动报错错误：找不到或无法加载主类 org.jruby.Main

这里提供一个特别zz的解决方案：
我在后续把IDEA的目录添加到环境变量中时，因为错把$IDEA_HOME写成$HBASE_HOME（复制粘贴的锅），导致环境变量中$HBASE_HOME被IDEA的目录所覆盖，因此出现如上报错。

所以可以先仔细检查环境变量文件，我当时就是没有全部看一遍，导致困扰许久。

6.4 关闭集群顺序

[hadoop@hadoop102 module]$ stop-hbase.sh
[hadoop@hadoop102 module]$ myhadoop.sh stop
[hadoop@hadoop102 module]$ myzk.sh stop

# 查看各服务器上的进程，正常关闭后，各服务器上均只剩下一个进程jps
[hadoop@hadoop102 module]$ jpsall

安装MAVEN & IDEA

1，解压安装

# 解压安装
## MAVEN
[hadoop@hadoop102 software]$ tar -zxvf apache-maven-3.6.3-bin.tar.gz -C /opt/module
## IDEA
[hadoop@hadoop102 software]$ tar -zxvf ideaIU-2017.2.7.tar.gz -C /opt/module

# 修改目录名和所属
[hadoop@hadoop102 module]$ mv apache* maven
[hadoop@hadoop102 module]$ mv idea* idea
[hadoop@hadoop102 module]$ sudo chown -R hadoop:hadoop maven idea
[hadoop@hadoop102 module]$ ll

2，设置环境变量

[hadoop@hadoop102 module]$ sudo vim /etc/profile.d/my_env.sh
[hadoop@hadoop102 module]$ source /etc/profile

添加下列内容

#MAVEN_HOME
export MAVEN_HOME=/opt/module/maven
export PATH=$PATH:$MAVEN_HOME/bin
#IDEA_HOME
export IDEA_HOME=/opt/module/idea
export PATH=$PATH:$IDEA_HOME/bin

3，测试 MAVEN

# 输入名令 mvn -v 可以查看版本号
[hadoop@hadoop102 module]$ mvn -v

4，修改MAVEN配置文件，使用阿里的镜像地址

[hadoop@hadoop102 conf]$ pwd
/opt/module/maven/conf
[hadoop@hadoop102 conf]$ vim settings.xml

找到mirrors标签，插入

id=alimaven
name=aliyun maven
url=http://maven.aliyun.com/nexus/content/groups/public/
mirrorOf=central

修改前：
修改后：

5，运行IDEA

[hadoop@hadoop102 conf]$ idea.sh

参考资料

教程相关
【1】尚硅谷大数据技术之 Hadoop（入门）
【2】hadoop3.x集群：配置、启动历史服务（history server，端口19888）
【3】【尚硅谷】大数据全套教程下载
【4】centos7安装IDEA配置Maven
【5】如何重新格式化Hadoop文件系统
【6】同一个局域网内如何共享文件夹（含共享打印机操作方法）
【7】在本地用idea连接虚拟机上的hbase集群

报错相关
【1】Hbase启动警告
【2】linux 终端启动图形化程序界面时报错：No protocol specified
【3】stop-hbase.sh一直处于等待状态

知识相关
【1】【hadoop 的坑】hadoop的配置文件slaves/workers
【2】Hadoop配置文件详解
【3】Zookeeper学习笔记
【4】Hbase的集群模式安装配置（笔记）
【5】maven-porm.xml详解
【6】hadoop3.x——历史服务器
【7】UUID详细介绍

实战项目
【1】HBase快速入门系列（九）| HBase 的实战案例（微博）

资源分享

链接：https://pan.baidu.com/s/1YnO6NQYrU4gGgx1kEVy1jA
提取码：MNZX

以上过程希望对你有所帮助！

欢迎评论区交流指教！

你可能感兴趣的:(笔记,hadoop,分布式,大数据,hbase,zookeeper)

学《梁宁产品思维30讲》有槽——微信为什么成为了今天的微信神秘的尹先生
缘起：朋友圈的高分评价文档由搜狗录音助手录制并转写，简单整理后发出，纯属一时兴起吐槽发出。搜狗录音提供了11个小时的免费的转写时长，相比于科大讯飞，搜狗在互联网产品的运营上面的确是更能够讨我们这些C端客户的芳心。他至少让我完整地试一下，如果我觉得效果真的非常好，我才会花这个钱，而讯飞那个就太急功近利了，一两分钟的体验真白瞎了我们去下载APP，希望他们能够换一批运营，关于有道云笔记、讯飞系列的对比吐
得到三周年直播收获简记张照浩
好久没有节奏性的学习得到了，我体会的结论是--一旦停止，前功尽弃，此言不虚啊~哈哈。学的少，进步的少，这就是我的代价。幸好在中午看到朋友分享海报，点进了得到三周年的直播，信息量很大，干货满满，当时没有记笔记，复盘一下，固化下知识，也便于今后再学习。我理解的这场直播为什么会有的原因如下：1、强化仪式感和节奏感。2、正向引导，尊重付出，给予反馈和获得感。3、价值吸引，强化品牌影响力，做推广。4、践行价
分布式文件存储（GlusterFS）入门指南，有一定难度！！ ubuntu 努力一点948 分布式gluster 分布式 ubuntu linux 服务器运维人工智能 gpu算力
以下有免费的4090云主机提供ubuntu22.04系统的其他入门实践操作地址：星宇科技|GPU服务器高性能云主机云服务器-登录相关兑换码星宇社区---4090算力卡免费体验、共享开发社区-CSDN博客兑换码要是过期了，可以私信我获取最新兑换码！！！之所以推荐给大家使用，是因为上面的云主机目前是免费使用的，不需要大家再去安装虚拟机，部署虚拟机，环境都搭配好了，非常适合新手入门，减少搭建的时间，把时
不可多得的风味小吃——读杨勇的《家园四书》（笔记4）潜2023
身为亳州人，谁不喜欢了解亳州事？读杨勇先生（雅不知）的《家园四书》，相当于走进了亳州，了解她的过去和现在。《家园四书》总共有四部分组成，每一部分都是一道亳州风味的小吃，让你了解亳州的同时，更能咀嚼出她的美。《历史书：明月前身》写了亳州诸多历史人物。写得厚重大气，篇篇有铮铮铁骨，文笔刚劲有力，也不乏诙谐，偶有文白相间之处，读来很有韵味，像作者的书法，需得细细地品。它是亳州的肉夹馍，咔吱一口咬下去，满
Matlab学习笔记：矩阵基础
MATLAB学习笔记：矩阵基础作为MATLAB的核心，矩阵是处理数据的基础工具。矩阵本质上是一个二维数组，由行和列组成，用于存储和操作数值数据。在本节中，我将详细讲解矩阵的所有知识点，包括创建、索引、运算、函数等，确保内容通俗易懂。我会在关键地方添加MATLAB代码示例，帮助你直观理解。最后，我会总结本课重点，并引出下一节“逻辑基础”的内容。一、什么是矩阵？在MATLAB中，矩阵是一个二维数组，元
ROS个人笔记
写在前面：由于个人原因距离上次学习ROS已经过去了2周时间，本以为时间不算长，但还是忘记了好多。因此写下这篇笔记，主要是记录学习过程中的概念性问题，程序代码可能会写，但是不是主要。1.ROS是什么：是一个生态系统，首先他是一个操作系统。统筹各种资源如通信，开发等。2.在以往开发时一旦工程庞大起来往往会对数据流通的耦合十分苦恼，因此ROS提供的通信方式为松耦合式的：节点Node。另外大工程时的另外一
Apache Ignite 的并发控制：实现高性能事务处理的关键 AI天才研究院 AI实战 AI人工智能与大数据 LLM大模型落地实战指南大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着大数据时代的到来，数据量的增长和计算能力的提升使得传统的数据库和计算模型已经无法满足业务需求。为了应对这些挑战，分布式计算和存储技术得到了广泛的研究和应用。ApacheIgnite是一款高性能的分布式数据库和计算平台，它可以提供实时性能和高可用性，同时支持事务处理和并发控制。在这篇文章中，我们将深入探讨ApacheIgnite的并发控制机制，以及如何实现高性能事务处理。我们将从以下
20180818《遇见心想事成的自己》读书笔记苗苗聊成长
读书时间：20180813-20180818此书主要分为两部分，第一部分是心想事成的秘密，第二部分是秘密后的秘密。看到这两个主题就想起，曾经有些时候，也会期盼着能够心想事成，让自己在困境中突围，然而往往不管用，上天总是不会给到你想要的东西。看了此书才恍然大悟，原来心想事成也有方法，也讲套路。秘密后的秘密，才是核心。在这个快餐式的时代，很多时候我们只学一些表面上的术，就想达成所愿，化解一切难题，往往
Apache Ignite SQL索引全面指南吕曦耘George
ApacheIgniteSQL索引全面指南索引概述在ApacheIgnite分布式数据库中，索引是优化SQL查询性能的核心机制。Ignite提供了多种索引类型和配置方式，帮助开发者根据不同的业务场景构建高效的查询系统。索引类型与创建方式1.自动创建索引Ignite会自动为以下字段创建索引：主键字段（PrimaryKey）亲和键字段（AffinityKey）这些基础索引为分布式查询提供了基本支持。2
Apache Ignite SQLLine工具使用指南侯霆垣
ApacheIgniteSQLLine工具使用指南概述ApacheIgnite作为一个分布式内存计算平台，提供了完整的SQL功能支持。SQLLine是Ignite内置的一个命令行工具，它允许开发者和数据库管理员通过交互式方式执行SQL查询和管理Ignite集群。本文将详细介绍如何使用SQLLine工具与Ignite集群进行交互。SQLLine工具简介SQLLine是一个基于控制台的JDBC客户端工
HCIP第一、二章笔记整理 aaaBsBsBsB 笔记网络 tcp/ip
第一章：TCP协议的扩展一、面向连接点到点：TCP通讯中仅存在通讯双方，无第三方。连接性质：非物理链路上的连接，而是逻辑上的连接。二、TCP的报文结构核心字段：包括源端口号（16位）、目标端口号（16位）、序列号（32位）、确认应答号（32位）、首部长度（4位）、保留位（6位）、标记位（如SYN、ACK、RST等）、窗口大小（16位）、校验和（16位）、紧急指针（16位）、选项（可变长度）及数据。
HCIP第一天课程笔记整理搞IT的马哥 IP 网络网络协议 tcp/ip 服务器
HCIP----huawei认证高级工程师抽象语言先转化成编码编码一定要转化成二进制（为什么一定要转化成二进制？）二进制信号转化成电信号处理电信号（协议等同于标准，目的就是提升服务）（1876年电话诞生，1946年第一台电子计算机诞生）OSI参考模型---OSI/RM---ISO（国际标准化组织）---1979年颁布开放式系统互联参考模型（应表会传网数物）应用层---提供各种应用服务，将抽象语言转
DolphinScheduler 如何高效调度 AnalyticDB on Spark 作业？ DolphinScheduler社区 spark 大数据分布式
DolphinScheduler是一个分布式易扩展的可视化DAG工作流任务调度开源系统，能高效地执行和管理大数据流程。用户可以在DolphinSchedulerWeb界面轻松创建、编辑和调度云原生数据仓库AnalyticDBMySQL版的Spark作业。前提条件AnalyticDBforMySQL集群的产品系列为企业版、基础版或湖仓版。AnalyticDBforMySQL集群中已创建Job型资源组
小红书增加曝光率晓谈小红书_46f9
小红书目前来说的话，主要是依靠内容口碑模式，社群类型营销，笔记，类似于大众电商类型，但是我个人觉得小红书更有优势，以下是我发过的一些操作推广小技巧可以了解下。推广大致大家都大同小异，我只能给予一些适当帮助，如有推广业务需求可以随时私聊我。以下是我个人一些增加曝光率一些方式1：过硬的内容加上适当的曝光，点赞，评论，收藏，转发，等于文章的热度与曝光率2：内容过硬的同时，文章也需要注意一下排版，底色，文
CA复习功课陈小铃子 linux 运维服务器云原生
RHCSA复习笔记（完善版）一、文件管理创建文件/目录：touch[文件名]：创建空文件或更新现有文件时间戳。mkdir[目录名]：创建目录。常用选项：-p递归创建多级目录。查看文件/目录：ls[选项][文件/目录]：列出目录内容。常用选项：-l详细列表，-a显示隐藏文件，-h人性化大小显示。cat[文件名]：查看文件内容（小文件），无法翻页。less[文件名]：分页查看文件内容，支持搜索（/），
《自由人生》读书笔记 2 西红柿阿达
原文:问题：“人生有何意义？”其实这个问题是容易解答的。人生的意义全是各人自己寻出来，造出来的：高尚、卑劣、清贵、污浊、有用、无用……全靠自己的作为。生命本身不过是一件生物学的事实，有什么意义可说？生一个人与一只猫、一只狗，有什么分别？人生的意义不在于何以有生，而在于自己怎样生活。你若情愿把这六尺之躯葬送在白昼做梦之上，那就是你这一生的意义。你若发愤振作起来，决心去寻求生命的意义，去创造自己的生命
C练题笔记之：牛客-HJ012.字符串反转
题目：描述接受一个只包含小写字母的字符串，然后输出该字符串反转后的字符串。（字符串长度不超过1000）输入描述：输入一行，为一个只包含小写字母的字符串。输出描述：输出该字符串反转后的字符串。示例1输入：abcd复制输出：dcba结果：解题思路：获取字符串，用双指针，一头一尾开始交换，直至到中间。代码：#include#includeintmain(){charstr[1024]={};scanf(
10分钟搞定 MinIO 单节点多磁盘部署！打造稳定高可用对象存储【二】
MinIO是一个**高性能、开源的对象存储系统**，主要用于存储非结构化数据（如图片、视频、文档、备份等），与AmazonS3完全兼容。它被广泛用于云原生应用、大数据分析、AI模型存储、容器平台（如Kubernetes）等场景。MinIO支持多种部署模式，其中：单节点单磁盘（Single-NodeSingle-Drive）模式适用于开发测试、小规模应用或资源受限的场景。它的部署简单，不依赖集群、分
高性能分布式对象存储-MinIO多节点部署 shangjg3 Java总结 java
MinIO是一个高性能的分布式对象存储服务，它可以配置为多节点（或多服务器）模式以提供高可用性和数据冗余。以下是一个基本的多节点MinIO部署示例：确保你有多个服务器或虚拟机。在每个节点上安装MinIO。使用minioserver命令启动多节
时序数据库在数据库领域的应用前景数据库管理艺术数据库时序数据库 struts ai
时序数据库在数据库领域的应用前景关键词：时序数据库、时间序列数据、物联网、监控系统、金融分析、大数据、实时分析摘要：本文深入探讨了时序数据库在现代数据管理中的关键作用和应用前景。我们将从时序数据的基本特性出发，分析时序数据库的核心架构和设计原理，比较主流时序数据库产品的技术特点，并通过实际案例展示其在物联网、金融科技、运维监控等领域的应用价值。文章还将提供时序数据库选型指南，探讨未来技术发展趋势，
STM32F4-ETH通信（lwip）——学习笔记_stm32 lwip 2401_84010497 程序员嵌入式
7、CSMA/CD冲突检测：8、MAC子层：MAC数据包、MAC数据包格式、MAC地址：MAC地址由48位数字组成，它是网卡的物理地址，在以太网传输的最底层，就是根据MAC地址来收发数据的。部分MAC地址用于广播和多播，在同一个网络里不能有两个相同的MAC地址。PC的网卡在出厂时已经设置好了MAC地址，但也可以通过一些软件来进行修改，在嵌入式的以太网控制器中可由程序进行配置。数据包中的DA是目标地
日更92/365：我为什么要写作？富足的徐欢
我为什么要写作？这是真是一个好问题，若在做一件事情之前，知道自己的目标动机和需求，才能排序，分配好自己的时间。余生我想把写作当成我的习惯，因为在写作上面我可以有下面三个方面的提升：1.整理笔记有时，我们听完一堂课，会感觉到心潮澎湃，可是若没有把它整理成笔记或写践行清单，假以时日，这些没有被运用或链接的知识信息会在大脑处抹去。所以整理笔记是最优的辅助学习方法。2.梳理情绪相信大家都有这种体验，当我们
解决修改android手机设置中字体大小后系统布局混乱的方法 f44148db1e8c
均属于笔记，仅供个人参考，有问题欢迎指正重写getResources方法@OverridepublicResourcesgetResources(){//returnsuper.getResources();//解决修改android手机设置中字体大小后系统布局混乱的方法，重构getResources，修改系统倍数对应用内sp的影响；Resourcesres=super.getResources(
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
读书笔记||《焦虑者自救手册》（二）徐小胖杂谈
书名：《焦虑者自救手册》阅读进度：43-83页阅读时间：30分钟阅读思考问题：1、关于忧虑的5种积极信念2、列举一个你的忧虑案例，用以上的五种积极信念进行分析，看看你赞成哪种或者哪几种信念？3、对忧虑进行审判时，我们通常需要扮演哪三种角色？4、用你自己忧虑的一个例子，分别用辩方律师和公诉律师的角度，为它辩护，写下证词。5、最终经过以上辩护，你将得出怎样的判决？金句摘抄：1、如果你对某件事感到忧虑，
消息队列MQ 不辉放弃 kafka 大数据开发数据库
消息队列（MessageQueue，简称MQ）是一种基于异步通信模式的中间件技术，核心作用是在分布式系统中实现消息的存储、传递和缓冲，解决不同组件/服务之间的通信耦合问题，提升系统的灵活性、可靠性和可扩展性。一、核心概念与本质消息队列的本质是一个“存储消息的容器”，但它并非简单的存储工具，而是通过一套规则（如消息路由、持久化、确认机制等）实现“生产者”和“消费者”的解耦通信：生产者（Produce
京东618大额券怎么领？京东有大额优惠券吗？直返APP淘客项目
京东618购物节：解锁APP直返大额券，畅享购物狂欢京东618购物节，这场年度购物盛宴，无疑是每一位消费者心中的期盼。在这场盛宴中，大额优惠券如同宝藏一般，等待着精明的你去发掘。而掌握领取大额券的秘诀，将让你的购物之旅更加畅快淋漓，尤其是当你充分利用京东APP的优势时。一、如何在京东APP轻松领取大额券？月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）返利就用
“重复”定义函数的睿智(Python/与ai助手“智普清言”深度交流) 梦幻精灵_cq 笔记学习
镜像双胞谬重复，定制便捷巧活工。笔记模板由python脚本于2025-07-1612:16:30创建，本篇笔记适合至少通晓一门语言，熟悉基本编程范式的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/F
偶拾《退让》，一阙仿七律带出的文化思考(中文诗创作) 梦幻精灵_cq 笔记学习
礼貌温言沐春风，谦让理解通彼此。笔记模板由python脚本于2025-07-0111:29:03创建，本篇笔记适合喜欢中文仿古七言诗的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/Free：大咖
Apache Ignite 的 SQL 功能和分布式查询机制
这段内容讲的是ApacheIgnite的SQL功能和分布式查询机制。我们可以从几个关键点来理解：一、Ignite是一个分布式SQL数据库✅特点：符合ANSI-99SQL标准水平扩展（可扩展到多个节点）容错（fault-tolerant）支持两种数据分布方式：分区（Partitioned）：数据分布在多个节点上复制（Replicated）：每个节点都有完整数据副本二、SQL功能支持✅DML语句：Ig
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

【教程】Hadoop完全分布式环境搭建全过程

文章目录

简介

内容&流程

一、模板虚拟机准备

安装模板虚拟机

1，选择 - 自定义（高级）

2，稍后安装操作系统（也可以选择直接安装，没有太大区别）

3，虚拟机名称只作标识该虚拟机的作用，自定义即可

4，处理器数量1，内核数量2

5， 内存4G & 硬盘50G

6，自定义硬件

7，开启此虚拟机，选择install centos 7（对应选项呈白色）

8，语言 - 中文 - 简体中文

9，日期和时间：亚洲-上海

10，软件选择：只选择GNOME桌面

11，安装位置：自动配置分区

12，网络和主机名

☭问题1：打开网络后出现DNS1或者无法连接网络

13， 开始安装

14， 设置ROOT密码

15， 创建用户

模板虚拟机环境准备

1， 配置静态网络

2，设置hostname

☭问题2：主机名变为bogon如何解决？

3，SSH免密登录

4，安装工具包

☭问题3：报错14: curl#6 - “Could not resolve host: mirrorlist.centos.org； 未知的错误”

5，关闭防火墙，并设置关闭防火墙开机自启

6，修改/etc/sudoers文件，使hadoop用户（普通用户）具有 root 权限，方便后期加 sudo 执行 root 权限的命令

7，在/opt 目录下创建 module、software 文件夹

8，卸载虚拟机自带JDK并重启虚拟机

二、克隆虚拟机准备

1，修改克隆机 IP

2，修改克隆机主机名

3，修改/etc/hosts文件

4，重启虚拟机

5，修改 windows 的主机映射文件

6，在hadoop102上安装JDK

☭问题4：执行 source /etc/profile命令时，报错：bash: ＃: 未找到命令

7，在hadoop102安装Hadoop

三、完全分布式环境部署

1，本地测试

2，编写集群分发脚本 xsync

3，ssh免密登录

4，集群配置

5，群起集群

6，配置历史服务器

7，配置日志的聚集

8，编写 Hadoop 集群常用脚本

9，时间同步

四、安装ZooKeeper、HBase、MAVEN和IDEA

ZooKeeper完全分布式部署

1，解压安装

2，配置服务器编号

3，配置 zoo.cfg 文件

☭问题5：启动ZooKeeper报错 mkdir: 无法创建目录".": 权限不够 ？

☭问题6：Zookeeper启动显示成功，zkServer.sh status报错？

4，集群操作

HBase安装

1，Zookeeper 正常部署

2，Hadoop 正常部署

3，HBase 的解压

4，HBase 的配置文件

☭问题7：HBase启动警告：Java HotSpot™ 64-Bit Server VM warning

5，HBase 远程发送到其他集群

6，HBase 服务的启动

☭问题8：HBase启动报错 错误：找不到或无法加载主类 org.jruby.Main

安装MAVEN & IDEA

1，解压安装

2，设置环境变量

3，测试 MAVEN

4，修改MAVEN配置文件，使用阿里的镜像地址

5，运行IDEA

参考资料

资源分享

你可能感兴趣的:(笔记,hadoop,分布式,大数据,hbase,zookeeper)

5，内存4G & 硬盘50G

13，开始安装

14，设置ROOT密码

15，创建用户

1，配置静态网络

☭问题3：报错14: curl#6 - “Could not resolve host: mirrorlist.centos.org；未知的错误”

☭问题5：启动ZooKeeper报错 mkdir: 无法创建目录".": 权限不够？

☭问题8：HBase启动报错错误：找不到或无法加载主类 org.jruby.Main