了解蓝鲸平台

一、什么是蓝鲸

 腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群(Interactive Entertainment Group,简称 IEG)自研自用的一套用于构建企业研发运营一体化的PAAS开发框架,提供了aPaaS(DevOps流水线,运行环境托管、前后台框架)和iPaaS(持续集成、CMDB、作业平台、容器管理、数据平台、AI等原子平台)等模块,帮助企业技术人员快速构建基础运行PaaS。就是自动化运维管理平台。他可以

  • 对资产即主机进行管理,业务划分
  • 对主机基础指标、中间件等的监控,告警,自愈等,像zabbix一样
  • 对文件进行快速分发、批量执行命令等,像ansible一样
  • 对日志进行检索

aPaaS是趋向SaaS和PaaS之间,iPaaS是趋向LaaS和PaaS之间

二、体系架构

 蓝鲸体系由原子平台和通用的一级SaaS服务组成,平台包括管控平台、配置平台、作业平台、数据平台、容器管理、PaaS平台、移动平台等,通用SaaS包括节点管理、标准运维、日志检索、蓝鲸监控、故障自愈等,为各种云的用户提供不同场景、不同需求的解决方案
了解蓝鲸平台_第1张图片

三、原子平台层

3.1 管控平台

蓝鲸管控平台,是整个蓝鲸平台的底层管控系统,是蓝鲸所有其他服务的基础,是蓝鲸服务体系与用户机器的连接器。

在整个蓝鲸体系中,蓝鲸管控平台作为蓝鲸的底层管控通道,没有提供独立的接口供用户直接访问调用,而是通过蓝鲸 esb 能力向上提供服务,供上层平台或者 SaaS 去实现场景赋能,蓝鲸管控平台主要提供了三种类型的服务能力:文件传输能力、实时任务执行能力、数据采集与传输的能力。
了解蓝鲸平台_第2张图片

3.2 配置平台

蓝鲸配置平台是一款面向应用的 CMDB,为应用提供了各种运维场景的配置数据服务。

功能
基础资源:包含业务和主机
业务资源:主要包括业务主机、业务拓扑(对业务进行细分)、进程管理、动态分组
权限控制:
模型管理:创建模型,配置字段。像创建机房模型,可以设置字段(地区,实例名,编号)

3.3 容器管理平台

蓝鲸容器服务(BCS,Blueking Container Service)是 高度可扩展、灵活易用的容器管理服务。蓝鲸容器服务支持两种不同的集群模式,分别为原生 Kubernetes 模式和基于 Mesos 自研的模式。

功能
镜像仓库
网络方案集成
存储方案集成

3.4 作业平台

作业平台(JOB)是一套基于蓝鲸智云管控平台 Agent 管道之上的基础操作平台,具备万级并发处理能力

功能
文件分发
作业执行
IP白名单:把对应业务下主机设置成白名单后,其他业务的主机可以在此主机下执行作业

四、SaaS场景层

4.1 节点管理

通过节点管理,可以对蓝鲸体系中的gse agent进行管理,包括状态查询、版本更新、配置管理、健康检查

功能
添加gse-agent
云区域管理

4.2 蓝鲸监控

可以对主机和互联网应用进行监控的产品,监控服务可用于收集主机资源的监控指标,探测服务的可用性并对其进行操作

功能
主机监控:对主机基础指标进行监控,像cpu、内存
进程监控:对进程端口、服务运行状态进行监控
组件监控:像nginx、apache、mysql
服务拨测:探测性服务,可以探测到对应URL的响应时间、状态,像对www.baidu.com进行拨测,探测响应时间,是否可用等
自定义监控:自己写脚本进行监控
权限管理:赋予角色对各个业务的权限

4.3 故障自愈

针对触发的告警,做相应的恢复操作

功能
告警自动处理:对告警进行自愈
组合套餐:及自愈动作

4.4 日志检索

可以监控日志,对日志做实时滚动,关键字检索

功能
采集项管理:以"模块(一个主机)"为单位进行采集,同时支持采集多个文件
关键字查询

4.5 标准运维

运维流程化,可以查看到每个步骤执行的成功失败状态

功能
流程模板:对脚本执行进行步骤分解,流程化

五、目录结构

安装完成后会出现下边三个目录

src:蓝鲸产品软件源目录,以及依赖的开源组件目录
install:部署脚本、后期维护脚本目录,管理脚本目录
bkcec:安装组件到此目录/data/bkcec

目录结构了解

[root@rbtnode1 data]# pwd
/data

#src第一层显示的是各个模块
[root@rbtnode1 data]# tree -L 1 src/
src/
├── bkdata
├── blueking.env
├── cert
├── cmdb
├── ENTERPRISE
├── fta
├── gse
├── gse_client-aix-powerpc.tgz
├── gse_client-linux-x86_64.tgz
├── gse_client-linux-x86.tgz
├── gse_client-windows-x86_64.tgz
├── gse_client-windows-x86.tgz
├── gse_proxy-linux-x86_64.tgz
├── job
├── license
├── MD5
├── miniweb
├── official_saas
├── open_paas
├── paas_agent
├── pip.conf
├── service
└── VERSION

#模块下边显示的位各个子工程
[root@rbtnode1 data]# tree -L 1 src/bkdata/
src/bkdata/
├── dataapi
├── databus
├── monitor
├── projects.yaml
├── support-files
└── VERSION

模块了解

  • iam:权限中心后台
  • usermgr:用户管理后台
  • open_paas(paas):PaaS平台
  • paas_agent:SaaS核心管理模块,分正式(appo),测试环境(appt)
  • gse:管控平台
  • cmdb:配置平台
  • job:作业平台
  • bkmonitor:蓝鲸监控后台
  • bkdata:数据基础模块,目前是从蓝鲸数据平台中抽出来的一小块功能精简版,主要支持“蓝鲸监控”、“日志检索“、“故障自愈”的SaaS应用
  • fta:故障自愈后台

/data/install/bkcec脚本说明

bkcec 是蓝鲸社区版的安装维护主脚本。
bkcec 的调用语法为:bkcec [project] [1]

sync: 从中控机的 src/ 同步安装 <module> 依赖的文件和目录到对应机器的 src/ 下。 
install: 安装 <module>$INSTALL_PATH(默认 /data/bkce)下。 
install 1: 等同于先执行 sync <module> ,再执行 install <module> ,合二为一。 
initdata: 安装后初始化,常用于模块的用户创建,sql 导入,权限设置等操作。 
render: 渲染模块的模板文件,install 过程中会调用它,做模板变量替换。 
status: 检查模块的进程是否运行。 
start: 启动模块的进程。 
stop: 停止模块的进程。 
upgrade: 升级更新模块。

想详细了解,可查看官方文档
蓝鲸文档中心:https://bk.tencent.com/docs/
企业版运维手册:https://docs.bk.tencent.com/bkee_ops/

你可能感兴趣的:(蓝鲸,蓝鲸智云,基础了解)