纯码农

【大数据】搭建Hadoop集群（附一键部署脚本）

汝之观览，吾之幸也！本文主要讲解Hadoop运行环境的搭建（三台虚拟机），一键脚本部署，全自动化，不再需要按照文档一个一个进行配置，脚本执行后就可登录hadoop集群。

文章目录

- - 一、最小安装CentOS
  - 二、准备jdk与hadoop包
  - 三、一键部署脚本分解
  - - 1、安装工具包
    - 2、修改主机名
    - 3、修改ip
    - 4、关闭防火墙
    - 5、创建用户
    - 6、解压jdk压缩包并配置jdk的环境变量
    - 7、解压hadoop压缩包并配置hadoop的环境变量
    - 8、克隆虚拟机（无脚本）
    - 9、分发脚本xsync
    - 8、免密登录
    - 8、配置当前的hadoop配置文件
    - 11、一键启动hadoop集群
    - 12、一键停止hadoop集群
    - 13、查看hadoop集群
  - 四、一键部署脚本集合

一、最小安装CentOS

如果使用Vmware安装虚拟机请看【大数据】用VMware搭建自己的虚拟机（选择最小安装，内存4G、磁盘50G）

最小安装好虚拟机后一般使用ifconfig 查看ip，但最小安装后是没有这个命令，我们也可以使用 ip addr show查看

ip addr show

二、准备jdk与hadoop包

在/opt 目录下建software、module文件夹，将压缩包放到software下

具体安装包可加公众号【纯码农（purecodefarmer）】输入“hadoop”即可获取下载链接

三、一键部署脚本分解

新建one、xsync脚本放到/bin目录下，赋权限

chmod +x one
chmod +x xsync
mv one /bin/
mv xsync /bin/

1、安装工具包

expect:expect工具包，实现自动交互功能
epel-release：额外的软件源，就可以安装更多的软件包
psmisc：工具包 
nc：工具包 
net-tools:网络工具（ifconfig） 
rsync:远程同步 
vim：vim编辑器 
lrzsz： 同步
ntp：时间同步
git：git库
libzstd、openssl-static、tree、 iotop：hadoop的标准库

脚本内容

yum install -y expect
yum install -y epel-release
yum install -y psmisc nc net-tools rsync vim lrzsz ntp libzstd openssl-static tree iotop git

执行脚本命令

one 0

2、修改主机名

脚本内容

echo "-------修改系统名称-------"
	hostnamectl --static set-hostname $1

执行脚本命令

one 2 hdp101 101

3、修改ip

脚本内容

echo "-------修改IP静态地址-------"
	#先检查文件是否已被修改过
	chk=`cat /etc/sysconfig/network-scripts/ifcfg-ens33 | grep static`
	if [ "$chk" == "" ];then
		#修改/etc/sysconfig/network-scripts/ifcfg-ens33文件中的dhcp
		sed -i 's/dhcp/static/' /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "IPADDR=192.168.10.$1" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "NETMASK=255.255.255.0" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "GATEWAY=192.168.10.2" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "DNS1=192.168.10.2" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "PREFIX=24" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		systemctl restart network
	else
		sed -i "s/IPADDR=192.168.10.101/IPADDR=192.168.10."$1"/" /etc/sysconfig/network-scripts/ifcfg-ens33
		systemctl restart network
	fi

执行脚本命令

one 3 hdp101 101

备注：需要看本机的ip与网关，修改ip之后需要重新登录

4、关闭防火墙

脚本内容

echo "-------关闭防火墙-------"
systemctl stop firewalld
systemctl disable firewalld

执行脚本命令

one 4

5、创建用户

脚本内容

echo "请注意,在创建用户时会先对该用户进行删除操作以确保脚本运行成功, 如已有该用户请慎重输入用户名!"
	read -p "继续请输入 1 ,停止请输入 2. : " IS_CONTINUE
	if [ ${IS_CONTINUE} -ne 1 ]; then
	  echo "停止运行该脚本!"
	  exit
	fi
	read -p "请输入新增用户用户名 : " username
	read -p "请输入新增用户密码 : " password
	userdel -r ${username}
	useradd -d /home/${username} ${username}
	expect -c"
	 spawn passwd ${username}
	 expect {
		 "*yes/no*" {send "yes\r";exp_continue}
		 "*New password:*" {send "${password}\r";exp_continue}
		 "*Retype new password:*" {send "${password}\r";exp_continue}
	}"
	echo "配置新增用户root权限"
	sed -i "93a "${username}" ALL=(ALL) NOPASSWD:ALL" /etc/sudoers
	echo "创建software、module文件夹"
	mkdir /opt/module /opt/software
	chown ${username}:${username} /opt/module /opt/software
	echo "切换用户"
	su - ${username}

执行脚本命令

one 1

6、解压jdk压缩包并配置jdk的环境变量

先建好文件夹

mkdir /opt/software /opt/module

脚本内容

echo "-------安装JDK并配置环境变量-------"
	#检查JDK是否已经安装过
	check_soft_folder jdk8
	if [ $? == 1 ];then
		#在opt文件夹下搜索jdk的tar.gz文件
		jdkName=`ls /opt/software/ | grep jdk*`
		#将文件解压到对应的soft文件夹下
		tar -zxvf /opt/software/$jdkName -C /opt/module/jdk8 --strip-components 1
		#配置/etc/profile文件
		sudo touch /etc/profile.d/my_env.sh
		echo "配置jdk环境变量"
		echo "" >> /etc/profile.d/my_env.sh
		echo "#java environment" >> /etc/profile.d/my_env.sh
		echo "export JAVA_HOME=/opt/module/jdk8" >> /etc/profile.d/my_env.sh
		echo "export CLASSPATH=.:\${JAVA_HOME}/jre/lib/rt.jar:\${JAVA_HOME}/lib/dt.jar:\${JAVA_HOME}/lib/tools.jar" >> /etc/profile.d/my_env.sh
		echo "export PATH=\$PATH:\${JAVA_HOME}/bin" >> /etc/profile.d/my_env.sh
	fi

执行脚本命令

one 5

7、解压hadoop压缩包并配置hadoop的环境变量

脚本内容

echo "-------安装Hadoop并配置环境变量-------"
	#检查JDK是否已经安装过
	check_soft_folder hadoop330
	if [ $? == 1 ];then
		#在opt文件夹下搜索Hadoop的tar.gz文件
		hadoopName=`ls /opt/software/ | grep hadoop*`
		#将文件解压到对应的soft文件夹下
		tar -zxvf /opt/software/$hadoopName -C /opt/module/hadoop330 --strip-components 1
		#配置/etc/profile.d/my_env.sh文件
		echo "配置hadoop环境变量"
		echo "" >> /etc/profile.d/my_env.sh
		echo "#hadoop environment" >> /etc/profile.d/my_env.sh
		echo "export HADOOP_HOME=/opt/module/hadoop330" >> /etc/profile.d/my_env.sh
		echo "export PATH=\$PATH:\${HADOOP_HOME}/bin" >> /etc/profile.d/my_env.sh
		echo "export PATH=\$PATH:\${HADOOP_HOME}/sbin" >> /etc/profile.d/my_env.sh
	fi

执行脚本命令

one 6

备注：非root用户配置环境变量

touch /etc/profile.d/my_env.sh

将下面的内容复制到my_env.sh中

#JAVA_HOME
export JAVA_HOME=/opt/module/jdk8
export PATH=$PATH:$JAVA_HOME/bin
##HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop330
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

8、克隆虚拟机（无脚本）

9、分发脚本xsync

脚本内容

# 获取输入参数个数，如果没有参数，直接退出
	pcount=$#
	if((pcount==0)); then
			echo no args...;
			exit;
	fi
	# 获取文件名称
	pname=$1
	fname=`basename $pname`
	echo fname=$fname
	# 获取上级目录到绝对路径
	pdir=`cd -P $(dirname $pname); pwd`
	echo pdir=$pdir
	# 获取当前用户名称
	user=`whoami`
	# 循环
	for((host=2; host<=3; host++)); do
			echo $pdir/$fname $user@hdp10$host:$pdir
			echo ==================hdp10$host==================
			rsync -rvl $pdir/$fname $user@hdp10$host:$pdir
	done
	#Note:这里的slave对应自己主机名，需要做相应修改。另外，for循环中的host的边界值

执行脚本命令

xsync /bin/one
xsync /bin/xsync

备注：在101修改配置文件后可使用xsync命令将所修改的文件分发到102、103

8、免密登录

脚本内容

echo "-------免密登录-------"
if [ ! -f ~/.ssh/id_rsa ];then
	echo "-------生成ssh密钥-------"
	ssh-keygen -t rsa
	expect -c"
	 expect {
		 "*.ssh/id_rsa*" {send "\r";exp_continue}
		 "*empty for no passphrase:*" {send "\r";exp_continue}
		 "*fingerprint is:*" {send "\r";exp_continue}
	}"
	echo "-------分发密钥-------"
	for host in hdp101 hdp102 hdp103
	do 
	ssh-copy-id $host
	done
else
	echo "-------id_rsa已存在，直接分发-------"
	for host in hdp101 hdp102 hdp103
	do 
	ssh-copy-id $host
	done
fi

执行脚本命令

one 8

备注：需要在101、102都执行一次

8、配置当前的hadoop配置文件

脚本内容

cd /opt/module/hadoop330/etc/hadoop
	# 配置hadoop-env.sh文件
	sed -i '25c export JAVA_HOME=/opt/module/jdk8' hadoop-env.sh
	echo "-------配置hadoop-env.sh文件完成------"

	# 配置core-site.xml文件 root是用户名，可更改
	sed -i '19a ' core-site.xml
	sed -i '20a fs.defaultFS' core-site.xml
	sed -i '21a hdfs://hdp101:8020' core-site.xml
	sed -i '22a ' core-site.xml
	sed -i '23a ' core-site.xml
	sed -i '24a hadoop.data.dir' core-site.xml
	sed -i '25a /opt/module/hadoop330/data' core-site.xml
	sed -i '26a ' core-site.xml
	sed -i '27a ' core-site.xml
	sed -i '28a hadoop.proxyuser.root.groups' core-site.xml
	sed -i '29a *' core-site.xml
	sed -i '30a ' core-site.xml
	sed -i '31a ' core-site.xml
	sed -i '32a hadoop.proxyuser.root.hosts' core-site.xml
	sed -i '33a *' core-site.xml
	sed -i '34a ' core-site.xml
	echo "-------配置core-site.xml文件完成-------"

	# 配置hdfs-site.xml文件
	sed -i '19a ' hdfs-site.xml
    sed -i '20a dfs.namenode.secondary.http-address' hdfs-site.xml
    sed -i '21a hdp103:9868' hdfs-site.xml
    sed -i '22a ' hdfs-site.xml
	sed -i '23a ' hdfs-site.xml
    sed -i '24a dfs.namenode.name.dir' hdfs-site.xml
    sed -i '25a file://${hadoop.data.dir}/name' hdfs-site.xml
    sed -i '26a ' hdfs-site.xml
    sed -i '27a ' hdfs-site.xml
	sed -i '28a dfs.datanode.data.dir' hdfs-site.xml
	sed -i '29a file://${hadoop.data.dir}/data' hdfs-site.xml
	sed -i '30a ' hdfs-site.xml
	sed -i '31a ' hdfs-site.xml
	sed -i '32a dfs.namenode.checkpoint.dir' hdfs-site.xml
	sed -i '33a file://${hadoop.data.dir}/namesecondary' hdfs-site.xml
	sed -i '34a ' hdfs-site.xml
	sed -i '35a ' hdfs-site.xml
	sed -i '36a dfs.client.datanode-restart.timeout' hdfs-site.xml
	sed -i '37a 30' hdfs-site.xml
	sed -i '38a ' hdfs-site.xml
	sed -i '39a ' hdfs-site.xml
	sed -i '40a dfs.namenode.http-address' hdfs-site.xml
	sed -i '41a hadoop101:9870' hdfs-site.xml
	sed -i '42a ' hdfs-site.xml
	echo "-------配置hdfs-site.xml文件完成-------"
	
	# 配置yarn-site.xml文件
	sed -i '18a ' yarn-site.xml
	sed -i '19a yarn.resourcemanager.hostname' yarn-site.xml
	sed -i '20a hdp102' yarn-site.xml
	sed -i '21a ' yarn-site.xml
	sed -i '22a ' yarn-site.xml
	sed -i '23a yarn.nodemanager.aux-services' yarn-site.xml
	sed -i '24a mapreduce_shuffle' yarn-site.xml
	sed -i '25a ' yarn-site.xml
	sed -i '26a ' yarn-site.xml
    sed -i '27a yarn.nodemanager.env-whitelist' yarn-site.xml
    sed -i '28a JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME' yarn-site.xml
    sed -i '29a ' yarn-site.xml
	echo "-------配置yarn-site.xml文件完成-------"

	# 配置mapred-site.xml
	sed -i '20a ' mapred-site.xml
	sed -i '21a mapreduce.framework.name' mapred-site.xml
	sed -i '22a yarn' mapred-site.xml
	sed -i '23a ' mapred-site.xml
	echo "-------配置mapred-site.xml文件完成-------"

	# 配置workers
	sed -i '2a hdp101' workers
	sed -i '3a hdp102' workers
	sed -i '4a hdp103' workers
	echo "-------配置workers文件完成-------"
	
	# 配置hadoop-env.sh
	sed -i '26a export HDFS_NAMENODE_USER=root' hadoop-env.sh
	sed -i '27a export HDFS_SECONDARYNAMENODE_USER=root' hadoop-env.sh
	sed -i '28a export HDFS_DATANODE_USER=root' hadoop-env.sh
	echo "-------配置hadoop-env.sh文件完成-------"
	
	cd /opt/module/hadoop330/sbin
	sed -i '2a HDFS_DATANODE_USER=root' start-dfs.sh
    sed -i '3a HDFS_DATANODE_SECURE_USER=hdfs' start-dfs.sh
    sed -i '4a HDFS_NAMENODE_USER=root' start-dfs.sh
    sed -i '5a HDFS_SECONDARYNAMENODE_USER=root' start-dfs.sh
	echo "-------配置start-dfs.sh文件完成-------"
	
	sed -i '2a HDFS_DATANODE_USER=root' stop-dfs.sh
    sed -i '3a HDFS_DATANODE_SECURE_USER=hdfs' stop-dfs.sh
    sed -i '4a HDFS_NAMENODE_USER=root' stop-dfs.sh
    sed -i '5a HDFS_SECONDARYNAMENODE_USER=root' stop-dfs.sh
	echo "-------配置stop-dfs.sh文件完成-------"
	
	sed -i '2a YARN_RESOURCEMANAGER_USER=root' start-yarn.sh
    sed -i '3a HDFS_DATANODE_SECURE_USER=yarn' start-yarn.sh
    sed -i '4a YARN_NODEMANAGER_USER=root' start-yarn.sh
	echo "-------配置start-yarn.sh文件完成-------"
	
	sed -i '2a YARN_RESOURCEMANAGER_USER=root' stop-yarn.sh
    sed -i '3a HDFS_DATANODE_SECURE_USER=yarn' stop-yarn.sh
    sed -i '4a YARN_NODEMANAGER_USER=root' stop-yarn.sh
	echo "-------配置stop-yarn.sh文件完成-------"
	# 格式化namenode并启动hadoop
	hadoop namenode -format
	echo "-------格式化namenode完成-------"

执行脚本命令

one 9

11、一键启动hadoop集群

脚本内容

	echo "-------hadoop集群启动-------"
	echo " --------------- 启动 hdfs ---------------"
	ssh hdp101 "/opt/module/hadoop330/sbin/start-dfs.sh"
	echo " --------------- 启动 yarn ---------------"
	ssh hdp102 "/opt/module/hadoop330/sbin/start-yarn.sh"
	echo " --------------- 启动 historyserver ---------------"
	ssh hdp102 "/opt/module/hadoop330/bin/mapred --daemon start historyserver"

执行脚本命令

one 10

12、一键停止hadoop集群

脚本内容

	echo "-------hadoop集群停止-------"
	echo " --------------- 关闭 historyserver ---------------"
	ssh hdp102 "/opt/module/hadoop330/bin/mapred --daemon stop historyserver"
	echo " --------------- 关闭 yarn ---------------"
	ssh hdp102 "/opt/module/hadoop330/sbin/stop-yarn.sh"
	echo " --------------- 关闭 hdfs ---------------"
	ssh hdp101 "/opt/module/hadoop330/sbin/stop-dfs.sh"

执行脚本命令

one 11

13、查看hadoop集群

jps

四、一键部署脚本集合

脚本内容

#!/bin/bash

# 安装工具包
install_package() { 
	echo "-------安装工具包-------"
	yum install -y expect
	yum install -y epel-release
    yum install -y psmisc nc net-tools rsync vim lrzsz ntp libzstd openssl-static tree iotop git dos2unix
}
# 统一配置hosts文件
modify_syshosts() { 
	echo "-------修改hosts文件-------"
	for hosts in 101 102 103 104 105 106
	do 
	echo "192.168.10."$hosts" hdp"$hosts"" >> /etc/hosts
	done
}

#修改系统名称 同时修改hosts文件
modify_sysname() { 
	echo "-------修改系统名称-------"
	hostnamectl --static set-hostname $1
}
 
#修改IP静态地址
modify_staticip() { 
	echo "-------修改IP静态地址-------"
	#先检查文件是否已被修改过
	chk=`cat /etc/sysconfig/network-scripts/ifcfg-ens33 | grep static`
	if [ "$chk" == "" ];then
		#修改/etc/sysconfig/network-scripts/ifcfg-ens33文件中的dhcp
		sed -i 's/dhcp/static/' /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "IPADDR=192.168.10.$1" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "NETMASK=255.255.255.0" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "GATEWAY=192.168.10.2" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "DNS1=192.168.10.2" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		echo "PREFIX=24" >> /etc/sysconfig/network-scripts/ifcfg-ens33
		systemctl restart network
	else
		sed -i "s/IPADDR=192.168.10.101/IPADDR=192.168.10."$1"/" /etc/sysconfig/network-scripts/ifcfg-ens33
		systemctl restart network
	fi
}
 
#关闭防火墙
close_firewalld() { 
	echo "-------关闭防火墙-------"
	systemctl stop firewalld
	systemctl disable firewalld
}
 
#修改yum源为阿里源
modify_yumsource() { 
	echo "-------修改yum源为阿里源-------"
	# 检查是否已有备份文件 如果有则说明已经做过了
	if [ -e /etc/yum.repos.d/CentOS-Base.repo_bak ];then
		echo "don't nothing!"
	else
		#首先安装wget命令
		yum install -y wget
		#修改yum
		cd /etc/yum.repos.d/
		mv CentOS-Base.repo CentOS-Base.repo_bak
		wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
		yum clean all
		yum makecache
	fi
	cd /
}

# 创建用户并切换用户
add_user() { 
	echo "请注意,在创建用户时会先对该用户进行删除操作以确保脚本运行成功, 如已有该用户请慎重输入用户名!"
	read -p "继续请输入 1 ,停止请输入 2. : " IS_CONTINUE
	if [ ${IS_CONTINUE} -ne 1 ]; then
	  echo "停止运行该脚本!"
	  exit
	fi
	read -p "请输入新增用户用户名 : " username
	read -p "请输入新增用户密码 : " password
	userdel -r ${username}
	useradd -d /home/${username} ${username}
	expect -c"
	 spawn passwd ${username}
	 expect {
		 "*yes/no*" {send "yes\r";exp_continue}
		 "*New password:*" {send "${password}\r";exp_continue}
		 "*Retype new password:*" {send "${password}\r";exp_continue}
	}"
	echo "配置新增用户root权限"
	sed -i "93a "${username}" ALL=(ALL) NOPASSWD:ALL" /etc/sudoers
	echo "创建software、module文件夹"
	mkdir /opt/module /opt/software
	chown ${username}:${username} /opt/module /opt/software
	echo "切换用户"
	su - ${username}
}
 
#检查文件的文件夹是否存在不存在就创建1个
check_soft_folder() { 
	echo "-------检查文件夹是否存在-------"
	if [ -e /opt/module/$1 ];then
		echo "/opt/module/$1 folder already exists"
		rm -rf $1
		return 1
	else
		mkdir /opt/module/$1
		return 1
	fi
}
 
#安装JDK 软件目录必须在/opt/software下 jdk目录命名为jdk8
setup_jdk() { 
	echo "-------安装JDK并配置环境变量-------"
	#检查JDK是否已经安装过
	check_soft_folder jdk8
	if [ $? == 1 ];then
		#在opt文件夹下搜索jdk的tar.gz文件
		jdkName=`ls /opt/software/ | grep jdk*`
		#将文件解压到对应的soft文件夹下
		tar -zxvf /opt/software/$jdkName -C /opt/module/jdk8 --strip-components 1
		#配置/etc/profile文件
		sudo touch /etc/profile.d/my_env.sh
		echo "配置jdk环境变量"
		echo "" >> /etc/profile.d/my_env.sh
		echo "#java environment" >> /etc/profile.d/my_env.sh
		echo "export JAVA_HOME=/opt/module/jdk8" >> /etc/profile.d/my_env.sh
		echo "export CLASSPATH=.:\${JAVA_HOME}/jre/lib/rt.jar:\${JAVA_HOME}/lib/dt.jar:\${JAVA_HOME}/lib/tools.jar" >> /etc/profile.d/my_env.sh
		echo "export PATH=\$PATH:\${JAVA_HOME}/bin" >> /etc/profile.d/my_env.sh
	fi
}

#安装Hadoop 软件目录必须在/opt/software下 hadoop目录命名为hadoop330
setup_hadoop() { 
	echo "-------安装Hadoop并配置环境变量-------"
	#检查JDK是否已经安装过
	check_soft_folder hadoop330
	if [ $? == 1 ];then
		#在opt文件夹下搜索Hadoop的tar.gz文件
		hadoopName=`ls /opt/software/ | grep hadoop*`
		#将文件解压到对应的soft文件夹下
		tar -zxvf /opt/software/$hadoopName -C /opt/module/hadoop330 --strip-components 1
		#配置/etc/profile.d/my_env.sh文件
		echo "配置hadoop环境变量"
		echo "" >> /etc/profile.d/my_env.sh
		echo "#hadoop environment" >> /etc/profile.d/my_env.sh
		echo "export HADOOP_HOME=/opt/module/hadoop330" >> /etc/profile.d/my_env.sh
		echo "export PATH=\$PATH:\${HADOOP_HOME}/bin" >> /etc/profile.d/my_env.sh
		echo "export PATH=\$PATH:\${HADOOP_HOME}/sbin" >> /etc/profile.d/my_env.sh
	fi
}

IP_LIST=(
hdp101
hdp102
hdp103
)
# 生成ssh密钥，用于免密登录
create_ssh() { 
echo "-------免密登录-------"
if [ ! -f ~/.ssh/id_rsa ];then
	echo "-------生成ssh密钥-------"
	ssh-keygen -t rsa
	expect -c"
	 expect {
		 "*.ssh/id_rsa*" {send "\r";exp_continue}
		 "*empty for no passphrase:*" {send "\r";exp_continue}
		 "*fingerprint is:*" {send "\r";exp_continue}
	}"
	echo "-------分发密钥-------"
	for host in hdp101 hdp102 hdp103
	do 
	ssh-copy-id $host
	done
else
	echo "-------id_rsa已存在，直接分发-------"
	for host in hdp101 hdp102 hdp103
	do 
	ssh-copy-id $host
	done
fi
}


# hadoop配置脚本
hadoop_config() { 
	cd /opt/module/hadoop330/etc/hadoop
	# 配置hadoop-env.sh文件
	sed -i '25c export JAVA_HOME=/opt/module/jdk8' hadoop-env.sh
	echo "-------配置hadoop-env.sh文件完成------"

	# 配置core-site.xml文件 root是用户名，可更改
	sed -i '19a ' core-site.xml
	sed -i '20a fs.defaultFS' core-site.xml
	sed -i '21a hdfs://hdp101:8020' core-site.xml
	sed -i '22a ' core-site.xml
	sed -i '23a ' core-site.xml
	sed -i '24a hadoop.data.dir' core-site.xml
	sed -i '25a /opt/module/hadoop330/data' core-site.xml
	sed -i '26a ' core-site.xml
	sed -i '27a ' core-site.xml
	sed -i '28a hadoop.proxyuser.root.groups' core-site.xml
	sed -i '29a *' core-site.xml
	sed -i '30a ' core-site.xml
	sed -i '31a ' core-site.xml
	sed -i '32a hadoop.proxyuser.root.hosts' core-site.xml
	sed -i '33a *' core-site.xml
	sed -i '34a ' core-site.xml
	echo "-------配置core-site.xml文件完成-------"

	# 配置hdfs-site.xml文件
	sed -i '19a ' hdfs-site.xml
    sed -i '20a dfs.namenode.secondary.http-address' hdfs-site.xml
    sed -i '21a hdp103:9868' hdfs-site.xml
    sed -i '22a ' hdfs-site.xml
	sed -i '23a ' hdfs-site.xml
    sed -i '24a dfs.namenode.name.dir' hdfs-site.xml
    sed -i '25a file://${hadoop.data.dir}/name' hdfs-site.xml
    sed -i '26a ' hdfs-site.xml
    sed -i '27a ' hdfs-site.xml
	sed -i '28a dfs.datanode.data.dir' hdfs-site.xml
	sed -i '29a file://${hadoop.data.dir}/data' hdfs-site.xml
	sed -i '30a ' hdfs-site.xml
	sed -i '31a ' hdfs-site.xml
	sed -i '32a dfs.namenode.checkpoint.dir' hdfs-site.xml
	sed -i '33a file://${hadoop.data.dir}/namesecondary' hdfs-site.xml
	sed -i '34a ' hdfs-site.xml
	sed -i '35a ' hdfs-site.xml
	sed -i '36a dfs.client.datanode-restart.timeout' hdfs-site.xml
	sed -i '37a 30' hdfs-site.xml
	sed -i '38a ' hdfs-site.xml
	sed -i '39a ' hdfs-site.xml
	sed -i '40a dfs.namenode.http-address' hdfs-site.xml
	sed -i '41a hadoop101:9870' hdfs-site.xml
	sed -i '42a ' hdfs-site.xml
	echo "-------配置hdfs-site.xml文件完成-------"
	
	# 配置yarn-site.xml文件
	sed -i '18a ' yarn-site.xml
	sed -i '19a yarn.resourcemanager.hostname' yarn-site.xml
	sed -i '20a hdp102' yarn-site.xml
	sed -i '21a ' yarn-site.xml
	sed -i '22a ' yarn-site.xml
	sed -i '23a yarn.nodemanager.aux-services' yarn-site.xml
	sed -i '24a mapreduce_shuffle' yarn-site.xml
	sed -i '25a ' yarn-site.xml
	sed -i '26a ' yarn-site.xml
    sed -i '27a yarn.nodemanager.env-whitelist' yarn-site.xml
    sed -i '28a JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME' yarn-site.xml
    sed -i '29a ' yarn-site.xml
	echo "-------配置yarn-site.xml文件完成-------"

	# 配置mapred-site.xml
	sed -i '20a ' mapred-site.xml
	sed -i '21a mapreduce.framework.name' mapred-site.xml
	sed -i '22a yarn' mapred-site.xml
	sed -i '23a ' mapred-site.xml
	echo "-------配置mapred-site.xml文件完成-------"

	# 配置workers
	sed -i '2a hdp101' workers
	sed -i '3a hdp102' workers
	sed -i '4a hdp103' workers
	echo "-------配置workers文件完成-------"
	
	# 配置hadoop-env.sh
	sed -i '26a export HDFS_NAMENODE_USER=root' hadoop-env.sh
	sed -i '27a export HDFS_SECONDARYNAMENODE_USER=root' hadoop-env.sh
	sed -i '28a export HDFS_DATANODE_USER=root' hadoop-env.sh
	echo "-------配置hadoop-env.sh文件完成-------"
	
	cd /opt/module/hadoop330/sbin
	sed -i '2a HDFS_DATANODE_USER=root' start-dfs.sh
    sed -i '3a HDFS_DATANODE_SECURE_USER=hdfs' start-dfs.sh
    sed -i '4a HDFS_NAMENODE_USER=root' start-dfs.sh
    sed -i '5a HDFS_SECONDARYNAMENODE_USER=root' start-dfs.sh
	echo "-------配置start-dfs.sh文件完成-------"
	
	sed -i '2a HDFS_DATANODE_USER=root' stop-dfs.sh
    sed -i '3a HDFS_DATANODE_SECURE_USER=hdfs' stop-dfs.sh
    sed -i '4a HDFS_NAMENODE_USER=root' stop-dfs.sh
    sed -i '5a HDFS_SECONDARYNAMENODE_USER=root' stop-dfs.sh
	echo "-------配置stop-dfs.sh文件完成-------"
	
	sed -i '2a YARN_RESOURCEMANAGER_USER=root' start-yarn.sh
    sed -i '3a HDFS_DATANODE_SECURE_USER=yarn' start-yarn.sh
    sed -i '4a YARN_NODEMANAGER_USER=root' start-yarn.sh
	echo "-------配置start-yarn.sh文件完成-------"
	
	sed -i '2a YARN_RESOURCEMANAGER_USER=root' stop-yarn.sh
    sed -i '3a HDFS_DATANODE_SECURE_USER=yarn' stop-yarn.sh
    sed -i '4a YARN_NODEMANAGER_USER=root' stop-yarn.sh
	echo "-------配置stop-yarn.sh文件完成-------"
	# 格式化namenode并启动hadoop
	hadoop namenode -format
	echo "-------格式化namenode完成-------"
}
 
# hadoop集群启动
hadoop_start() { 
	echo "-------hadoop集群启动-------"
	echo " --------------- 启动 hdfs ---------------"
	ssh hdp101 "/opt/module/hadoop330/sbin/start-dfs.sh"
	echo " --------------- 启动 yarn ---------------"
	ssh hdp102 "/opt/module/hadoop330/sbin/start-yarn.sh"
	echo " --------------- 启动 historyserver ---------------"
	ssh hdp102 "/opt/module/hadoop330/bin/mapred --daemon start historyserver"
}
# hadoop集群停止
hadoop_stop() { 
	echo "-------hadoop集群停止-------"
	echo " --------------- 关闭 historyserver ---------------"
	ssh hdp102 "/opt/module/hadoop330/bin/mapred --daemon stop historyserver"
	echo " --------------- 关闭 yarn ---------------"
	ssh hdp102 "/opt/module/hadoop330/sbin/stop-yarn.sh"
	echo " --------------- 关闭 hdfs ---------------"
	ssh hdp101 "/opt/module/hadoop330/sbin/stop-dfs.sh"
}
# 分发脚本
xsync() { 
	# 获取输入参数个数，如果没有参数，直接退出
	pcount=$#
	if((pcount==0)); then
			echo no args...;
			exit;
	fi
	# 获取文件名称
	pname=$1
	fname=`basename $pname`
	echo fname=$fname
	# 获取上级目录到绝对路径
	pdir=`cd -P $(dirname $pname); pwd`
	echo pdir=$pdir
	# 获取当前用户名称
	user=`whoami`
	# 循环
	for((host=2; host<=3; host++)); do
			echo $pdir/$fname $user@hdp10$host:$pdir
			echo ==================hdp10$host==================
			rsync -rvl $pdir/$fname $user@hdp10$host:$pdir
	done
	#Note:这里的slave对应自己主机名，需要做相应修改。另外，for循环中的host的边界值
}

#安装mysql5.7
setup_mysql() { 
	#检查linux的mariadb是否卸载 如果没有说明没有安装过mysql
	mdb=`rpm -qa | grep mariadb`
	if [ "$mdb" != "" ];then
		rpm -e --nodeps $mdb
		cd /opt/
		wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm
		yum -y install mysql57-community-release-el7-10.noarch.rpm
		yum -y install mysql-community-server
		#修改/etc/my.cnf文件解决中文乱码
		sed -i '/socket/a character-set-server=utf8' /etc/my.cnf
		echo "[client]" >> /etc/my.cnf
		echo "default-character-set=utf8" >> /etc/my.cnf
		echo "[mysql]" >> /etc/my.cnf
		echo "default-character-set=utf8" >> /etc/my.cnf
		systemctl start  mysqld.service
		#获取临时密码
		pwdinfo=`grep "password" /var/log/mysqld.log| grep -wF "temporary password"`
		passwd=${pwdinfo#*localhost:}
		passwd=$(echo $passwd)
		#执行修改密码语句
		mysql -uroot -p$passwd --connect-expired-password -e "set global validate_password_policy=0"
		mysql -uroot -p$passwd --connect-expired-password -e "set global validate_password_length=1"
		mysql -uroot -p$passwd --connect-expired-password -e "ALTER USER 'root'@'localhost' IDENTIFIED BY 'okok'"
		#修改远程登录
		mysql -uroot -pokok -e "GRANT ALL PRIVILEGES ON *.* TO root@'%' IDENTIFIED BY 'okok'"
		mysql -uroot -pokok -e "flush privileges"
		#重启服务
		systemctl restart mysqld.service
	fi
}

#根据用户的选择进行对应的安装
custom_option() { 
case $1 in 
	0)
		install_package
		;;
	1)
		add_user
		;;
	2)
		modify_sysname $2 $3
		modify_staticip $3
		;;
	3)
		close_firewalld
		;;
	4)
		modify_yumsource
		;;
	5)
		setup_jdk
		;;
	6)
		setup_hadoop
		;;
	7)
		setup_mysql
		;;
	8)
		create_ssh
		;;
	9)
		hadoop_config
		;;
	10)
		hadoop_start
		;;
	11)
		hadoop_stop
		;;
	12)
		xsync
		;;
	98)
		install_package
		modify_sysname $2 $3
		modify_staticip $3
		modify_syshosts
		close_firewalld
		;;
	99)
		setup_jdk
		setup_hadoop
		hadoop_config
		;;
	*)
	 echo "please option 1~12、98、99"
esac
}
 
#规定$1用户安装软件选择[] $2用户传入必须是系统的名称(hdp101~hdp103) $3用户传入必须是IP地址(101~103)
custom_option $1 $2 $3

执行脚本命令

# 不同命令
0：安装工具包
1：新增用户
2：修改主机名与ip
3：关闭防火墙
4：配置yum源
5：安装jdk
6：安装hadoop
7：安装mysql
8：设置免密
9：配置hadoop文件
10：启动hadoop集群
11：关闭hadoop集群
12：xsync同步文件
98：从安装工具包到关闭防火墙
99：安装jdk、hadoop、配置hadoop
one [0~12|98|99] hdp101~hdp103 101~103

你可能感兴趣的:(大数据,Hadoop,hadoop,大数据,分布式)

GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
大模型训练数据库Common Crawl WindyChanChan 数据集语言模型数据库
CommonCrawl介绍‌‌CommonCrawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。CommonCrawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌CommonCrawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据
慢速连接攻击是什么？慢速连接攻击怎么防护？快快小毛毛网络 ddos 服务器
慢速连接攻击（SlowConnectionAttack），又称慢速攻击（SlowlorisAttack），是一种网络攻击技术，旨在通过占用服务器上的所有可用连接资源来使其无法响应正常请求。与传统的拒绝服务（DoS）和分布式拒绝服务（DDoS）攻击不同，慢速攻击并不依赖于发送大量数据包来消耗带宽，而是利用HTTP、TCP或SSL等协议的特性，通过发送大量不完整的请求或缓慢发送数据来占用服务器资源，使
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
Gobelieve 架构 weixin_34099526 数据库 golang json
Gobelievegithub地址声明:转简书JackieF的文章,为了自己方便copy了一份,加一些自己的东西.链接：https://www.jianshu.com/p/8121d6e85282IMCore主要分三大块:im客户连接服务器（可分布式部署，暂无负载均衡模块)imr路由查询服务器（主要解决im分布式部署的问题）ims存储服务器(主从部署)基础模块1.数据包协议包：header(12)
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
疫情，疫情东山草
2020年，疫情爆发，至今已近三年，反反复复，此起彼伏。不但没被消灭，还自我发展，从德尔塔到奥密克戎，与时俱进的变异着。去年11月，疫情之下，大数据800米范围内，都成为时空伴随者。“你的码儿有没有变颜色”“你绿码还是黄码”成为那段时间的流行语，当然少不了的还有全员核酸。段子手整出来一首歌：我走过你走过的路,这算不算相逢？我吹过你吹过的风，这算不算相拥？800米内我们不曾擦肩而过，你却要我14天相
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
Kafka 基础与架构理解 StaticKing KAFKA kafka
目录前言Kafka基础概念消息队列简介：Kafka与传统消息队列（如RabbitMQ、ActiveMQ）的对比Kafka的组件Kafka的工作原理：消息的生产、分发、消费流程Kafka系统架构Kafka的分布式架构设计Leader-Follower机制与数据复制Log-basedStorage和持久化Broker间通信协议Zookeeper在Kafka中的角色总结前言Kafka是一个分布式的消息系
Rides实现分布式锁，保障数据一致性,Redisson分布式事务处理朱杰jjj 缓存分布式
分布式环境下分布式锁有三种方式：基于数据库分布式锁基于Redis分布式锁基于zk分布式锁本帖只介绍Redis分布式锁为什么需要用到分布式锁？在单机环境下一个服务中多个线程对同一个事物或数据资源进行操作时，可以通过添加加锁方式（synchronized和lock）来解决数据一致性的问题。但是如果出现多个服务的情况下，这时候我们在通过synchronized和lock的方式来加锁会出现问题，因为多个服
机电综合管理系统架构小熊coder 机载系统系统架构
文章目录一、机电综合管理系统架构1.系统概述2.架构层次3.核心组件二、余度管理1.余度概述2.硬件冗余3.软件冗余4.通信冗余三、总线架构1.MIL-STD-1553B总线2.ARINC429总线3.ARINC629总线4.AFDX/ARINC664总线四、未来发展趋势1.分布式架构2.高速网络3.智能化与自动化结语机电综合管理系统（ElectromechanicalManagementSyst
华为云分布式缓存服务DCS与开源服务差异对比 hcinfo_18 redis使用华为云 Redis5.0 分布式缓存服务 Redis客户端
分布式缓存服务DCS提供单机、主备、集群等丰富的实例类型，满足用户高读写性能及快速数据访问的业务诉求。支持丰富的实例管理操作，帮助用户省去运维烦恼。用户可以聚焦于业务逻辑本身，而无需过多考虑部署、监控、扩容、安全、故障恢复等方面的问题。DCS基于开源Redis、Memcached向用户提供一定程度定制化的缓存服务，因此，除了拥有开源服务缓存数据库的优秀特性，DCS提供更多实用功能。一、与开源Red
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
Dubbo架构概览：服务注册与发现、远程调用、监控与管理木南曌 dubbo 架构
Dubbo是一个成熟的、高性能的、基于Java的微服务开发框架，它主要用于解决分布式系统中的服务治理问题，包括服务的注册与发现、远程过程调用（RPC）、服务监控与管理等多个关键环节。以下是Dubbo架构概览的详细介绍：服务注册与发现Dubbo的服务注册与发现机制是其核心功能之一，它依赖于注册中心来管理服务的生命周期和定位服务提供者。1.服务提供者（Provider）服务提供者是实际提供服务的节点，
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置