CentOS7+蓝鲸云6.0.2安装(超详细)

文章目录

      • 一、基础环境
        • 1.1、三台都安装并修改基础环境
        • 1.2、修改网卡信息
      • 二、正式部署环境(主控机操作):
        • 2.1、解压证书包(主控机操作)
        • 2.2、部署初始化common
        • 2.3、部署 PaaS
        • 2.4、部署 app_mgr[SaaS运行环境]
        • 2.5、部署 cmdb[配置平台]
        • 2.6、部署 job[作业平台]
        • 2.7、部署 bknodeman[节点管理]
      • 三、网站页面环境操作(主控机操作):
        • 3.1、配置本地hosts
        • 3.2、配置本地rabbit
      • 四、继续部署安装操作(主控机操作):
        • 4.1、部署 bkmonitorv3[监控平台]
        • 4.2、部署 bklog[日志平台]
        • 4.3、部署fta[故障自愈后台]
        • 4.4、部署saas-o bk_iam[权限中心]
        • 4.5、部署saas-o bk_user_manage[用户管理]
        • 4.6、部署saas-o bk_sops[标准运维]
        • 4.7、部署saas-o bk_itsm[服务流程管理]
        • 4.8、部署saas-o bk_fta_solutions[故障自愈]
        • 4.9、初始化蓝鲸业务拓扑
        • 4.10、加载蓝鲸相关维护命令
        • 4.11、检查全部配置与服务状态
      • 五、访问蓝鲸开始使用:
        • 5.1、节点管理修改全局配置
        • 5.2、在全局配置里新建,填写nodeman节点 ip和域名
        • 5.3、全局配置填写1
        • 5.4、全局配置填写2
        • 5.5、修改bknome地址
        • 5.6、节点管理->agent管理安装
      • 六、总结:

前言

  1. 安装蓝鲸云有非常多随机性,如果到了某一个步骤卡着了,重装吧O(∩_∩)O哈哈。
  2. 服务器配置三台4核cpu16g内存50g硬盘(玩玩16g内存就够了,但是使用了一段时间发现重启服务后内存不够导致部分服务起不来,建议内存都上32g)
  • 部署环境:
    系统版本:CentOS7.5
    Master-IP:192.168.130.233,CPU8核,内存24G
    Slave1-IP:192.168.130.234,CPU8核,内存24G
    Slave2-IP:192.168.130.235,CPU8核,内存24G

蓝鲸云安装包下载链接

一、基础环境

1.1、三台都安装并修改基础环境

# yum install -y epel-release rsync deltarpm pssh jq
# cat << EOF >> /etc/security/limits.conf
root soft nofile 102400
root hard nofile 102400
EOF
# mv /etc/localtime /etc/localtime.bak && ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
# echo "umask 0022" |tee -a ~/.bashrc
# echo "nameserver 127.0.0.1" |tee -a /etc/resolv.conf
# hostnamectl set-hostname [三台名字别取一样]
# systemctl stop firewalld && systemctl disable firewalld
# sed -i 's/^SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
# mkdir ~/.pip && cat << EOF > ~/.pip/pip.conf		//配置pip源
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
trusted-host = pypi.tuna.tsinghua.edu.cn
EOF
# cat >> /etc/profile <

1.2、修改网卡信息

如果NetworkManager是停止的可以跳过这个步骤
修改服务从NetworkManager到network

# systemctl status NetworkMnager
● NetworkManager.service - Network Manager
   Loaded: loaded (/usr/lib/systemd/system/NetworkManager.service; enabled; vendor preset: enabled)
   Active: active (running) since Wed 2021-04-14 04:15:14 EDT; 4h 13min ago
     Docs: man:NetworkManager(8)
 Main PID: 784 (NetworkManager)
   CGroup: /system.slice/NetworkManager.service
           └─784 /usr/sbin/NetworkManager --no-daemon

# uuidgen eth0
47a68f4f-d5f4-40de-8241-33a96a2ab167
# route add -host 根据当前网卡地址 gw 根据当前网关 dev eth0
# route add -host 192.168.130.233 gw 192.168.130.254 dev eth0
# cat << EOF >/etc/sysconfig/network-scripts/ifcfg-eth0
TYPE=Ethernet
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
NAME=eth0
UUID=自己生成新的
ONBOOT=yes
HWADDR=根据当前网卡    // ip a可以查看mac地址
PEERDNS=yes
PEERROUTES=yes
IPV6_PEERDNS=yes
IPV6_PEERROUTES=yes
IPADDR=根据当前网卡
NETMASK=255.255.255.0
GATEWAY=根据当前网卡网关
DNS1=8.8.8.8
EOF
# systemctl stop NetworkManager
# systemctl disable NetworkManager
# systemctl start network
# systemctl enable network
# reboot

二、正式部署环境(主控机操作):

# mkdir /data			//下载包移动到/data下
# mv bkce_src-6.0.2.tgz /data/ && cd /data && tar xf bkce_src-6.0.2.tgz
# cd /data/src/; for f in *gz;do tar xf $f; done		//解压各个产品软件包

到蓝鲸页面下载证书
ip a查看mac地址,网页上分号隔开。
52:54:00:33:06:f4;52:54:00:34:3c:de;52:54:00:0b:83:5d
把下载的证书上传到服务器的/data路径下

2.1、解压证书包(主控机操作)

# install -d -m 755 /data/src/cert
# tar xf /data/ssl_certificates.tar.gz -C /data/src/cert/
# chmod 644 /data/src/cert/*
# cp -a /data/src/yum /opt		//拷贝 rpm 包文件夹到/opt/目录
cat << EOF >/data/install/install.config
192.168.130.233 iam,ssm,usermgr,gse,license,redis,consul,es7,monitorv3(influxdb-proxy),monitorv3(monitor),monitorv3(grafana)
192.168.130.234 nginx,consul,mongodb,rabbitmq,appo,influxdb(bkmonitorv3),monitorv3(transfer),fta,beanstalk
192.168.130.235 paas,cmdb,job,mysql,zk(config),kafka(config),appt,consul,log(api),nodeman(nodeman)
EOF
# bash /data/install/configure_ssh_without_pass		//设置免密登陆

2.2、部署初始化common

# cd /data/install/ && ./bk_install common		//执行每台服务器初始化操作(主控机操作)[[执行两次安装命令]]。安一次依赖包安不完全
# ./health_check/check_bk_controller.sh		//检查相关配置,都OK即为成功

如果没有下面提示,请重新安装
在这里插入图片描述

报错Stderr: http://192.168.130.233:8080/repodata/repomd.xml: [Errno 14] curl#7 - "Failed connect to 192.168.130.233:8080; No route to host"
# yum --disablerepo=bk-custom //执行这个命令

若出现No package mysql-community-client available.的情况手动安装or执行安装下一步paas的时候自己会下载(可管可不管)
# rpm -ivh https://repo.mysql.com//mysql57-community-release-el7-11.noarch.rpm //[参考链接:https://blog.csdn.net/u010886217/article/details/83690006]
# yum -y install mysql-community-client

2.3、部署 PaaS

# ./bk_install paas		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错curl: (6) Could not resolve host: pass.service.consul; Unknow error"
# vi /usr/local/openresty/nginx/conf/nginx.conf //编辑nginx,在nginx那台服务器上192.168.130.234。保存后等五分钟再从新安装paas
http {
include mime.types;
default_type application/octet-stream;
server_names_hash_bucket_size 64; //加此行
log_format main '$remote_addr - $remote_user [$time_local] “$request” ’
'$status $body_bytes_sent “$http_referer” ’
‘"$http_user_agent" “$http_x_forwarded_for”’;

  • 安装paas之后需要修改/data/install/support-files/templates/nginx/paas.conf 里面的ip地址(默认127)到对应的服务端口
# netstat -anpt|grep uwsgi		//三台服务器同时输入此命令找出是哪一台启动了此端口
tcp        0      0 192.168.130.235:8000    0.0.0.0:*               LISTEN      13970/uwsgi
# vi /data/install/support-files/templates/nginx/paas.conf		//(主控机上操作)
# vim:ft=sh
# upstream - web

upstream OPEN_PAAS_APPENGINE {
    {
    { range service "paas-appengine" }}server {
    { .Address }}:{
    { .Port }} max_fails=1 fail_timeout=30s;
    {
    {else}}server 192.168.130.235:8000;{
    { end }}
}
upstream OPEN_PAAS {
    {
    { range service "paas-paas" }}server {
    { .Address }}:{
    { .Port }} max_fails=1 fail_timeout=30s;
    {
    {else}}server 192.168.130.235:8001;{
    { end }}
}
upstream OPEN_PAAS_ESB {
    {
    { range service "paas-esb" }}server {
    { .Address }}:{
    { .Port }} max_fails=1 fail_timeout=30s;
    {
    {else}}server 192.168.130.235:8002;{
    { end }}
}
upstream OPEN_PAAS_LOGIN {
    {
    { range service "paas-login" }}server {
    { .Address }}:{
    { .Port }} max_fails=1 fail_timeout=30s;
    {
    {else}}server 192.168.130.235:8003;{
    { end }}
}
upstream OPEN_PAAS_CONSOLE {
    {
    { range service "paas-console" }}server {
    { .Address }}:{
    { .Port }} max_fails=1 fail_timeout=30s;
    {
    {else}}server 192.168.130.235:8004;{
    { end }}
}

upstream OPEN_PAAS_APIGW {
    {
    { range service "paas-apigw" }}server {
    { .Address }}:{
    { .Port }} max_fails=1 fail_timeout=30s;
    {
    {else}}server 192.168.130.235:8005;{
    { end }}
}
  • 接着修改nginx初始模版(在192.168.130.234这一台上面[安装nginx的服务器])
# vi /etc/consul-template/templates/nginx.conf	
http {
    include       mime.types;
    default_type  application/octet-stream;
    server_names_hash_bucket_size 64;		//加此行
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
  • 停止paas程序,重启nginx/openresty,重新渲染模版,启动paas(主控机执行)
# ./bkcli stop paas
# ./bkcli restart nginx
# ./bkcli start paas

2.4、部署 app_mgr[SaaS运行环境]

# ./bk_install app_mgr		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

2.5、部署 cmdb[配置平台]

# ./bk_install cmdb		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

2.6、部署 job[作业平台]

# ./bk_install job		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错CentOS7+蓝鲸云6.0.2安装(超详细)_第1张图片
# ./bkcli restart bkiam //iam启动失败,执行如下命令
# ./bkcli check bkiam
# ./bkcli initdata cmdb
/data/install/health_check/check_cmdb_blueking_id
CentOS7+蓝鲸云6.0.2安装(超详细)_第2张图片
其他命令
# ./bkcli status job //查看job的状态
# pcmd -m job systemctl start bk-job-crontab.service //重新启动job的各个进程
# pcmd -m job systemctl status bk-job-crontab.service
数据库连接
# mysql --login-path=default-root //登陆方式在192.168.130.235登陆
> show variables like’%time_zone’;

2.7、部署 bknodeman[节点管理]

# ./bk_install bknodeman		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错如果安装bknodeman出现deploy failed: timeout
重启# ./bkcli restart yum

三、网站页面环境操作(主控机操作):

  • nodeman 节点上的nginx也需要添加 server_names_hash_bucket_size 64;
# vi /usr/local/openresty/nginx/conf/nginx.conf //编辑nginx,在nginx的nginx服务器上192.168.130.234。保存后等五分钟再从新安装paas
http {
include mime.types;
default_type application/octet-stream;
server_names_hash_bucket_size 64; //加此行
log_format main '$remote_addr - $remote_user [$time_local] “$request” ’
'$status $body_bytes_sent “$http_referer” ’
‘"$http_user_agent" “$http_x_forwarded_for”’;
# ./bkcli restart nginx		//重启

3.1、配置本地hosts

下面介绍的操作均可能覆盖现有 hosts ,进行操作前请先确认是否需要备份。
Windows 配置 用文本编辑器(如Notepad++)打开文件: C:\Windows\System32\drivers\etc\hosts将以下内容复制到上述文件内,并将以下 IP 需更换为PCwindows可以访问的 IP,然后保存。

192.168.130.234  paas.bktencent.com cmdb.bktencent.com job.bktencent.com jobapi.bktencent.com
192.168.130.235  nodeman.bktencent.com
  • 注意:192.168.130.234 为 nginx 模块所在的机器,192.168.130.235 为 nodeman 模块所在的机器。IP 需更换为PCwindows浏览器可以访问的IP。

3.2、配置本地rabbit

192.168.130.234  paas.bktencent.com cmdb.bktencent.com job.bktencent.com jobapi.bktencent.com
192.168.130.235  nodeman.bktencent.com

登陆paas,浏览器上输入域名
paas.bktencent.com
CentOS7+蓝鲸云6.0.2安装(超详细)_第3张图片
在任意一台机器上,执行以下命令,获取管理员账号和密码。

# grep -E "BK_PAAS_ADMIN_USERNAME|BK_PAAS_ADMIN_PASSWORD" /data/install/bin/04-final/usermgr.env
BK_PAAS_ADMIN_PASSWORD=cF2VRrktGmAW
BK_PAAS_ADMIN_USERNAME=admin

点击开发者中心
CentOS7+蓝鲸云6.0.2安装(超详细)_第4张图片
输入rabbitmq.service.consul 到地址里,在任意一台机器上,执行以下命令,获取管理员账号和密码。

# grep RABBITMQ /data/install/bin/01-generate/dbadmin.env
BK_RABBITMQ_ERLANG_COOKIES=Qk9JT3lnSW1HMA==
BK_RABBITMQ_ADMIN_PASSWORD=fgkUzy2SuntX
BK_RABBITMQ_ADMIN_USER=admin

CentOS7+蓝鲸云6.0.2安装(超详细)_第5张图片
点击激活与刷新。

四、继续部署安装操作(主控机操作):

4.1、部署 bkmonitorv3[监控平台]

# ./bk_install bkmonitorv3		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错如果安装bknodeman出现deploy failed: timeout
重启# ./bkcli restart yum

4.2、部署 bklog[日志平台]

# ./bk_install bklog		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错如果安装bknodeman出现deploy failed: timeout
重启# ./bkcli restart yum

4.3、部署fta[故障自愈后台]

# ./bk_install fta		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错如果安装bknodeman出现deploy failed: timeout
重启# ./bkcli restart yum

4.4、部署saas-o bk_iam[权限中心]

# ./bk_install saas-o bk_iam		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错如果安装bknodeman出现deploy failed: timeout
重启# ./bkcli restart yum

4.5、部署saas-o bk_user_manage[用户管理]

# ./bk_install saas-o bk_user_manage		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错如果安装bknodeman出现deploy failed: timeout
重启# ./bkcli restart yum

4.6、部署saas-o bk_sops[标准运维]

# ./bk_install saas-o bk_sops		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错如果安装bknodeman出现deploy failed: timeout
重启# ./bkcli restart yum

4.7、部署saas-o bk_itsm[服务流程管理]

# ./bk_install saas-o bk_itsm		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错如果安装bknodeman出现deploy failed: timeout
重启# ./bkcli restart yum

4.8、部署saas-o bk_fta_solutions[故障自愈]

# ./bk_install saas-o bk_fta_solutions		//(主控机操作)

如果没有下面提示,请重新安装
在这里插入图片描述

报错如果安装bknodeman出现deploy failed: timeout
重启# ./bkcli restart cmdb

4.9、初始化蓝鲸业务拓扑

# ./bkcli initdata topo		//(主控机操作)

如果没有报错,则成功

如果运行topo出现错误
到中控机运行下/usr/local/openresty/nginx/sbin/nginx -t 是否有报错,如果报错更具相关报错百度修改下。或到https://bk.tencent.com/s-mart/community/question/1545

4.10、加载蓝鲸相关维护命令

# source ~/.bashrc		//(主控机操作)

4.11、检查全部配置与服务状态

# cd /data/install/		//(主控机操作)
# echo bkssm bkiam usermgr paas cmdb gse job consul bklog | xargs -n 1 ./bkcli check

都是[SUCCESS]则安装完成

五、访问蓝鲸开始使用:

5.1、节点管理修改全局配置

CentOS7+蓝鲸云6.0.2安装(超详细)_第6张图片
CentOS7+蓝鲸云6.0.2安装(超详细)_第7张图片

5.2、在全局配置里新建,填写nodeman节点 ip和域名

CentOS7+蓝鲸云6.0.2安装(超详细)_第8张图片

  • Zookeeper账号密码查询
# cat /data/install/bin/01-generate/gse.env
BK_GSE_ZK_AUTH=zkuser:k71ySbAYRvOJ

CentOS7+蓝鲸云6.0.2安装(超详细)_第9张图片

5.3、全局配置填写1

  • 这里解释一下Agent安装包URL第二个空是填写公网IP访问地址,这里测试暂时不会用到公网,故此没有填写,投机取巧用的内网IP。两个空都可填写域名

CentOS7+蓝鲸云6.0.2安装(超详细)_第10张图片

5.4、全局配置填写2

  1. Linux默认不用填写,Windows照下面填写。47000、ges_client-windows-x86.tgz、ges_client-windows-x86_64.tgz、ges_client-linux-x86.tgz、ges_client-linux-x86_64.tgz

CentOS7+蓝鲸云6.0.2安装(超详细)_第11张图片

  1. 创建接入点成功
    CentOS7+蓝鲸云6.0.2安装(超详细)_第12张图片

5.5、修改bknome地址

  • 到nodeman节点192.168.130.235填写bknome地址或域名这个步骤非常重要。我这里就填写的内网的IP地址。
# cat /data/bkce/bknodeman/nodeman/bin/environ.sh
#!/bin/sh

# 节点管理公网回调地址
if [ "" == "" ]; then
    bkapp_nodeman_outer_callback_url="http://192.168.130.235:80/backend"
#    bkapp_nodeman_outer_callback_url="http:///backend"
else
    bkapp_nodeman_outer_callback_url=""
fi

# 节点管理内网回调地址
if [ "" == "" ]; then
    bkapp_nodeman_callback_url="http://192.168.130.235:10300/backend"
else
    bkapp_nodeman_callback_url=""
fi

# ./bkcli restart nodeman		//(主控机)修改后重启

5.6、节点管理->agent管理安装

CentOS7+蓝鲸云6.0.2安装(超详细)_第13张图片

安装云区域服务器如果下载太慢可以通过修改安装脚本从本机引用安装包。
先到已经安装好了云区域服务器进入/tmp 目录
把gse_proxy-linux-x86_64.tgz 发送到另一台服务器上/root/下

六、总结:

  • 这东西真的安装得够呛,后续怎样使用或许会换一篇文章发布
  1. 感谢这位老哥的支持与配合,推荐一波他做的网站与他写的部署博客放在下方:
    根据ip所在地,然后找到对应的DNS服务器网站
    蓝鲸云安装网站参考博客
  2. 另外一篇蓝鲸云安装参考博客
  3. 贴几个官方的有用网站
    官方部署操作手册
    服务器机器重启应对
    JVM优化项
    官方白皮书
  4. 也感谢群里蓝鲸云交流区给我的帮助,群号495299374
  5. 有其他错误或没写到的地方,可以给我留言、私信

你可能感兴趣的:(CentOS,运维,centos,linux)