vmware腾讯蓝鲸运维开发平台的搭建

蓝鲸运维平台4.0正式上线,通过资料的查看,发现对于运维来说简直就是神器。该平台大部分架构采用的是django开发的,顺便记录下我对蓝鲸运维平台的理解。

  • 蓝鲸运维平台是一个Paas集成框架,,如果想不通过开发的手段对自身公司的业务进行深度契合是不可能的。
  • 蓝鲸平台集成框架中,通过一步一步可以将自带cmdb,任务调度job,agent信息采集,bkdata日志大数据(elk),自愈平台,网络管理功能。
  • 可以理解为蓝鲸集成框架就是一套精简微服务框架,通过http等api进行远程调用,通过日志的抓取,进行故障分析处理等等。
  • 通过蓝鲸官方的django框架可以进行对公司自身业务的契合快速开发,并且通过集成平台进行快速部署上线。
该平台使用很多第三方软件及框架进行处理,情况如下:
图片.png

蓝鲸运维平台集成框架的细节如下:

  • 集成框架平台Paas
    • 该平台包含账户调用,应用调度,快速开发部署等等功能。
    • 目前包含django应用login,ESB,paas,appenging
    • 第三方服务需求,
      图片.png

废话不多说,安装要求,由于是在自己的电脑上安装平台进行自身的开发测试。
vmware虚拟化的需求,至少4G内存,低于4G别装啦,卡到你想砸电脑,还有就是最好是固态硬盘,普通硬盘也吃不消。
直接通过官方的安装文档,相当简单http://bk.tencent.com/document/bkbuild/000417.html
安装过程中遇到的问题如下:
我这边用的是centos7,最小化安装。

关闭防火墙
systemctl disable firewalld.service
systemctl stop firewalld.service
配置selinux
修改/etc/selinux/config 文件
将SELINUX=enforcing改为SELINUX=disabled
配置好 yum 源,包括 EPEL 仓库(通过yum info nginx测试一下)
yum makecache
yum -y install epel-release
yum install net-tools.x86_64

通过上面的完成以后,进行直接安装即可。
出现的安装问题如下:

脚本存在问题,安装JOB调度平台的时候MQ数据库的时候会报错,因为脚本改动啦系统的主机名,导致无法启动MQ数据库,所以中断啦,
解决如下:
直接hostname localhost,直接新建一个命令行。
直接手工启动/sbin/service rabbitmq-server start
查看状态rabbitmqctl status。如果未出现Error: unable to connect to node rabbit@xxx: nodedow,则正常。
正常后,重新运行脚本安装,全部安装完成。
由于nginx只认域名访问,需要修改自己访问主机的hosts文件,添加虚拟机的IP地址192.168.20.210 paas.blueking.com

安装完成后可以正常使用,重启虚拟机后结果发现通过./bkcec start paas,结果连浏览器访问异常,这个是因为重启后其他第三方服务都没有启动。
启动流程如下:

## 启动paas
./bkcec start mysql
./bkcec start license
./bkcec start redis
./bkcec start nginx
./bkcec start paas
    ---------------------------------------------------------------------------------------------------------
    [192.168.20.210] open_paas    appengine                        RUNNING   pid 3650, uptime 0:18:21
    [192.168.20.210] open_paas    esb                              RUNNING   pid 3649, uptime 0:18:21
    [192.168.20.210] open_paas    login                            RUNNING   pid 3648, uptime 0:18:21
    [192.168.20.210] open_paas    paas                             RUNNING   pid 3647, uptime 0:18:21
启动cmdb
./bkcec start mongodb
./bkcec start zk
./bkcec start gse
./bkcec start cmdb
    [192.168.20.210] server      cmdb_adminserver                 RUNNING   pid 4964, uptime 0:16:34
    [192.168.20.210] server      cmdb_apiserver                   RUNNING   pid 4955, uptime 0:16:34
    [192.168.20.210] server      cmdb_auditcontoller              RUNNING   pid 4954, uptime 0:16:34
    [192.168.20.210] server      cmdb_datacollection              RUNNING   pid 4963, uptime 0:16:34
    [192.168.20.210] server      cmdb_eventserver                 RUNNING   pid 4962, uptime 0:16:34
    [192.168.20.210] server      cmdb_hostcontroller              RUNNING   pid 4948, uptime 0:16:34
    [192.168.20.210] server      cmdb_hostserver                  RUNNING   pid 4949, uptime 0:16:34
    [192.168.20.210] server      cmdb_objectcontroller            RUNNING   pid 4951, uptime 0:16:34
    [192.168.20.210] server      cmdb_proccontroller              RUNNING   pid 4965, uptime 0:16:34
    [192.168.20.210] server      cmdb_procserver                  RUNNING   pid 4953, uptime 0:16:34
    [192.168.20.210] server      cmdb_toposerver                  RUNNING   pid 4950, uptime 0:16:34
    [192.168.20.210] server      cmdb_webserver                   RUNNING   pid 4952, uptime 0:16:34
启动job调度平台

./bkcec start rabbitmq
        hostname localhost
        /sbin/service rabbitmq-server start
        
./bkcec start job


#启动开发者agent平台
./bkcec start appo
[192.168.20.210] paas_agent(O)    paas_agent                       RUNNING   pid 9206, uptime 0:01:15
[192.168.20.210] nginx: RUNNING

最后,通过第三方平台下载saas应用,比如agent自动安装平台,主机监控平台.
部署上线后正常,但重启vm失效,解决方案,安装完成后通过ps -ef|grep uwsgi,查看应用平台的启动方式。

#bk_monitor,主机性能分析
/data/bkce/paas_agent/apps/Envs/bk_monitor/bin/uwsgi --ini /data/bkce/paas_agent/apps/projects/bk_monitor/conf/bk_monitor.ini
#bk_agent_setup自动部署
/data/bkce/paas_agent/apps/Envs/bk_agent_setup/bin/uwsgi --ini /data/bkce/paas_agent/apps/projects/bk_agent_setup/conf/bk_agent_setup.ini

完成,现在可以很happy的从官方下载django模块进行定制化开发工作啦。
公司准备部署8节点的正式环境使用,有空把遇到的问题写出来。

你可能感兴趣的:(vmware腾讯蓝鲸运维开发平台的搭建)