一、问题背景:
学习使用自动运维工具saltstack的过程中,其中state模块是帮助管理员控制minion达到一个预想的状态。换句话来说,我想让minion能够远程执行命令,自动配置环境文件,软件安装、服务启动、关闭,信息收集等自动化操作,都能通过saltstack的state模块实现。
并且最重要的一个好处就是简单、简洁、方便。引用一段官方文档的话:
Simplicity, Simplicity, Simplicity
Many of the most powerful and useful engineering solutions are founded on simple principles. Salt States strive to do just that: K.I.S.S. (Keep It Stupidly Simple)
The core of the Salt State system is the SLS, or SaLt State file. The SLS is a representation of the state in which a system should be in, and is set up to contain this data in a simple format. This is often called configuration management.
二、前期准备:
state模块是saltstack最核心的模块之一,通过预先定制好的SLS文件对被控主机进行状态管理。可支持包括程序包(pkg),文件(file)、网络配置(network)、系统服务(service)、系统用户(user)。
更多状态模块的用法可以参考官网:
https://docs.saltstack.com/en/latest/ref/states/all/index.htm
关于YAML
SLS文件的默认渲染器是YAML渲染器。YAML是一种具有强大功能的标记语言。而saltstack就是使用一部分YAML来映射非常常用的数据结构,例如列表和字典。YAML渲染器的工作就是采用YAML数据结构将其编译为Python数据结构供saltstack使用。
关于YAML标记语言只需记住三个基本规则:
规则一、缩进:
YAML使用固定缩进来表示数据层之间的关系,要求每个级别的缩进刚好两个空格。
规则二、冒号:
字典键在YAML中表示由冒号分割的字符串。值有冒号后面的字符串表示,由空格分割。
规则三、破折号:
为了表示项目列表,使用单个短划线后跟空格。多个项目是同一个列表的一部分,具有同级别的缩进。
通过几个示例帮助大家了解一下:
1、YAML:
my_key : my_value
在Python中,上面的映射到:
{‘my_key’:’my_value’}
2、YAML:
first_level_dict_key:
second_leve_dict_key : file_dict_key
在Python中,上面相当于字典的嵌套:
{‘first_level_dict_key’ :{‘second_leve_dict_key’ : ‘ file_dict_key’}}
3、YAML:
first_dict:
- first_file_dict
- second_file_dict
- third_file_dict
在Python,上面映射到:
{‘first_dict’:[first_file_dict’,’second_file_dic’,’third_file_dict’]}
有时候当我们写完sls文件时,想看下写的格式或者渲染到Python数据结构是否正确,可以通过在线YAML解析来查看Python的输出:
http://yaml-online-parser.appspot.com/
对于YAML就不在详解了,有兴趣的可以多了解下。在这里只需要记住这几个规则,对于接下来的sls文件编写和理解有很多帮助。
三、环境说明:
由于硬件资源有限,测试环境采用两台服务器进行部署,两台服务器扮演不同的角色:
IP 角色 系统环境 193.192.128.5 Master Centos7.5 192.168.128.6 Minion Centos7.5 具体搭建过程不详细讲解,今天重点主要是state模块,如果对搭建部署有疑问的可以到我之前写过的一篇文章查看:
https://blog.51cto.com/mbb97/2084530
部署搭建之后,需要对master机器上的master配置文件修改,我将Salt文件服务器的目录设置到了/opt/base/下。并且设置top.sls为管理配置的入口文件。top.sls 默认从 base 标签开始解析执行,下一级是操作的目标,可以通过正则,grain模块,或分组名,来进行匹配,再下一级是要执行的state文件,不包含扩展名。
四、实战训练
统一安装部署Httpd服务
因为我的系统是Centos系统,所以安装httpd,不同的系统安装apache时,软件包名字都不一样,选择与你系统相对应的软件名。
定义top.sls文件
对httpd创建/opt/base/top.sls文件,可以分别通过正则、分组名、grain模式几种方式进行主机匹配:
base:
"*":
- init.httpd_init.httpd
#通过正则匹配
定义state
创建/opt/base/init/httpd_init/init/httpd.sls文件,上面的top.sls中匹配到minion主机,都将会执行httpd.sls文件中的内容。然后对httpd.sls文件中写入内容:
httpd:
pkg.installed:
- name: httpd
service.running:
- name: httpd
- require:
- pkg: httpd
sls文件详解:上述代码检查httpd服务是否已安装,如果未安装则将通过yum方式安装,检查httpd服务进程是否启动运行。下面对各行进行说明:
第一行用于定义state名称,不唯一,也可去其他相关名称
第二行和第四行表示state声明开始,使用了pkg和service模块,分别管理软件包状态,管理服务状态。pkg.installed确保软件包已安装,如果没有安装进行安装;service.running确保服务处于运行状态。
第三行和第五行是分别传递给pkg.installed和service.running模块的参数。
第六行require指的是本state执行时需要先执行哪些state。
执行state
salt ‘mbb-6’ state.highstate
执行结果
因为之前minion主机安装过httpd服务,所以它显示已经安装,并启动了
统一部署安装Openfalcon的agent服务
OpenFalcon是一款由小米运维团队从互联网公司的需求出发, 根据多年的运维经验,结合市面上使用的一些运维监控系统的使用经验和反馈,开发的一套企业级、高可用、可扩展的开源监控解决方案。
其中agent是用于采集机器负载监控指标,比如cpu.idle、load.1min、disk.io.util。所以agent需要部署到所要监控的机器上,并且设置为开机自启动。
之前在mbb-5虚拟机上搭建了一套openfalcon系统,现在只需要将已经配置好的agent组件放在/opt/base/packages目录下。
agent修改过的配置文件(agent/config/cfg.json):
通过start.sh,stop.sh控制启动和停止agent(用于自启动服务)
创建openfalcon_init目录:
创建agent.sls文件用于同步已经配置agent组件目录,并且将自启agent服务添加到rc.local文件。webuser_create用于创建web用户。
agent.sls:
# 部署Openfalcon的agent组件到被监控的机器上
# 通过salt命令:salt 主机 'state.sls' init.openfalcon.agent
include:
- init.openfalcon_init.webuser_create
openfalcon-dir:
file.recurse:
- name: /home/work/open-falcon
- source: salt://packages/minion
- user: web
- group: web
- dir_mode: 755
- file_mode: 755
- makedirs: True
cmd.run:
- name: runuser -l web -c "sh /home/work/open-falcon/start.sh"
- unless: ps -ef | grep falcon-agent | grep -v grep
openfalcon-start:
file.append:
- name: /etc/rc.d/rc.local
- text: 'runuser -l web -c "sh /home/work/open-falcon/start.sh"'
cmd.run:
- name: chmod 755 /etc/rc.d/rc.local
sls文件详解:代码具体结构的含义就不详讲了,值得讲下就是file和cmd模块;分别用于管理文件状态和执行命令。
file.append将指定内容添加到指定文件。file.recurse通过主服务器的子目录进行递归,并将所属子目录复制到指定的路径。
- name:用于设置递归的目录;
- source:源目录,该目录位于salt主文件服务器上,并使用salt://协议,就是在之前设置过的/opt/base目录下;
- user:所属用户;group:所属组;
- dir_mode、file_mode:目录、文件权限设置。
cmd.run如果满足某些条件,则运行命令;- name:要执行的命令;
- unless:作为检查命令。当在系统进程中没有发现falcon-agent进程时,则会执行启动命令。
最开始使用 include 可以包含现有state文件而不必重新写,所以将创建web用户的sls文件包含起来。
webuser_create.sls
web:
group.present:
- name: web
- gid: 8888
- system: True
user.present:
- fullname: web
- shell: /bin/bash
- home: /home/web
- uid: 8888
- gid: 8888
- groups:
- web
sls文件详解:group和user模块分别管理用户组和用户。group.present中的参数name:要创建组的名称,gid:分配指定组的组ID,system:命名组是否为系统组。user.present也类似,就不在详说。
执行state
salt 'mbb-6' 'state.sls' 'init.openfalcon_init.agent'
五、总结:
saltstack是自动化运维必备的工具,之前对saltstck接触的也不深,都只是单纯的通过saltstack远程执行命令等,到最近业务中需要通过批量部署Openfalcon的agent组件,才了解到saltstack这个state核心的模块。当然在这里所涉及到的可能只是state模块一小部分功能,他的功能还远不止这么简单,有兴趣可以多看看saltstack的官网,里面详解了许多自动化的功能,当然这需要结合业务去完成这些事情,不然这些将变得没有任何意义。
而从这里可以看出对于自己运维工作,其实还有许多方面可以拓展,不能只满足于一点,从本质上看问题,才能看到全貌。
以下是我参考的一些网站,博客,有兴趣的可以了解一下:
Saltstack自动化(五)sls文件使用
http://www.361way.com/salt-states/5350.html
saltstack(五) saltstack的state状态管理
https://www.cnblogs.com/phennry/p/5416859.html