运维自动化之ansible

项目场景:

公司计划在年底做一次大型市场促销活动,全面冲刺下交易额,为明年的上市做准备。公司要求各业务组对年底大促做准备,运维部要求所有业务容量进行三倍的扩容,并搭建出多套环境可以共开发和测试人员做测试。

技术说明:

ansible聚集以上部署和命令执行于一身,能够完整轻易的实现应用部署和批量命令功能,适用于主机数量中型规模,再大的规模用puppet

ansible是基于 paramiko 开发的,并且基于模块化工作,本身没有批量部署的能力。真正具有批量部署的是ansible所运行的模块,ansible只是提供一种框架。ansible不需要在远程主机上安装client/agents,因为它们是基于ssh来和远程主机通讯的。

ansible工作模式:

Ansible系统由控制主机对被管节点的操作方式可分为两类,即ad- hocplaybook

    ad-hoc模式(点对点)使用单个模块,支持批量执行单条命令。 ad-hoc 命令是一种可以快速输入的命令,而且不需要保存起来的命令。就相当于bash中的一句话shell

    playbook模式是Ansible主要管理方式,也是Ansible功能强大的关键所在。playbook通过多个task集合完成一类功能,如Web服务的安装部署、数据库服务器的批量备份等。可以简单地把playbook理解为通过组合多条ad-hoc操作作的配置文件。

ansible特点:

1、部署简单,只需在主控端部署Ansible环境,被控端无需做任何操作;

2、默认使用SSH协议对设备进行管理;

3、有大量常规运维操作模块,可实现日常绝大部分操作。

4、配置简单、功能强大、扩展性强;

5、支持API及自定义模块,可通过Python轻松扩展;

6、通过Playbooks来定制强大的配置、状态管理;

7、轻量级,无需在客户端安装agent,更新时,只需在操作机上进行一次更新即可;

8、提供一个功能强大、操作性强的Web管理界面和REST API接口 ——AWX平台。

Ansiblie命令执行过程

运维自动化之ansible_第1张图片 

1、加载自己的配置文件 默认/etc/ansible/ansible.cfg

2、查找对应的主机配置文件,找到要执行的主机或者组

3、加载自己对应的模块文件,如command

4、通过ansible将模块或命令生成对应的临时py文件,并将该文件传输至远程服务器

5、对应主机执行用户的家目录的.ansible/tmp/XXX/XXX.PY文件

6、给文件+x执行

7、执行并返回结果

8、删除临时py文件,sleep 0退出

Ansible常用命令集

/usr/bin/ansible     临时命令执行工具,常用于临时命令的执行。

/usr/bin/ansible-doc  模块功能查看工具。

/usr/bin/ansible-playbook 定制自动化的任务集编排工具,即按照剧本执行命令的

常用命令示例:

查看模块列表:ansible-doc -l

获取指定模块的使用帮助:ansible-doc -s MOD_NAME

临时命令执行:ansible [-f forks] [-m module_name] [-a args] [-C] [-v]

Host-pattern指明单个主机或者主机组

-f 指定并发连接数

-m 指明使用的模块

-a 指明使用的模块参数

-C表示只是测试而不真正执行,可以用来预测

-v 显示详细信息,还可以使用-vv-vvv....

项目准备:

Ansible服务器node1ip172.17.13.134

主机组web:node2及node3ip172.17.13.135  172.17.13.136

项目实现:

一、安装ansible,有两种方式,任选一种即可

1、使用yum安装:yum install ansible -y

2、使用pippython的包管理模块)安装:yum install python-pip;pip install ansible


二、配置ansible使用公钥验证,实现无密码远程连接:

虽然ansible支持其他主机认证方式,但是我们最常用的的还是基于秘钥的认证:

1、首先生成秘钥

ssh-keygen -t rsa -P ''

2、然后向主机分发秘钥:

ssh-copy-id [root@]ip #@后面跟主机名或者IP地址

实现效果:无密码连接

blob.png 


三、配置主机组:

在/etc/ansible/hosts文件中加入主机组

  比如[web]

     172.17.13.135

       172.17.13.136  表示在web主机组里配置两个主机

组成员也可以使用通配符来匹配,如下 172.17.13.[135:137] #表示匹配从172.17.13.135-172.17.13.137的主机。

也可以直接添加主机而不需要主机组。


四、主机连通性测试:

ansible web -m ping

运维自动化之ansible_第2张图片 


利用Ansible的模块来实现运维自动化


1、Command

命令模块接受命令名称,后面是空格分隔的列表参数。给定的命令将在所有选定的节点上执行。它不会通过shell进行处理,比如$HOME操作和”小于”<,>, |, ;,&”等操作。

Command模块的参数:

chdir # 在执行命令之前,先切换到该目录

示例:切换到/tmp目录之后再使用ls查看文件

       ansible web -m command -a 'chdir=/tmp ls'

creates # 一个文件名,当这个文件存在,则该命令不执行,可以用来做判断

示例:当/tmp存在则不执行后面的命令

         ansible web -m command -a 'creates=/tmp ls'  

     blob.png 

executable # 切换shell来执行命令,需要使用命令的绝对路径

free_form # 要执行的Linux指令,一般使用Ansible-a参数代替。

removes # 一个文件名,这个文件不存在,则该命令不执行,creates相反的判断

示例:当/tmp存在则执行后面的命令

          ansible web -m command -a 'removes=/tmp ls'  


2、shell模块在远程主机上调用shell解释器运行命令,支持shell的各种功能,例如管道等

示例:过滤出/etc/passwd文件中的root

ansible web -m shell -a 'cat /etc/passwd |grep "root"'

 运维自动化之ansible_第3张图片


3、copy:复制文件到远程主机,可以改权限等

用法:

(1) 复制文件

   -a “src= dest=

(2) 给定内容生成文件

   -a 'content=  dest=  mode="'

相关选项如下:

backup:在覆盖之前,将源文件备份,备份文件包含时间信息。yes|no代表备份|不备份

content:用于替代“src”,可以直接设定指定文件的内容

dest:必选项。要将源文件复制到的远程主机的绝对路径,如果源文件是一个目录,那么该路径也必须是个目录

mode:设定权限

directory_mode:递归设定目录的权限,默认为系统默认权限

force:如果目标主机包含该文件,但内容不同,如果设置为yes,则强制覆盖,如果为no,则只有当目标主机的目标位置不存在该文件时,才复制。默认为yes

others:所有的file模块里的选项都可以在这里使用

src:被复制到远程主机的本地文件,可以是绝对路径,也可以是相对路径。如果路径是一个目录,它将递归复制。在这种情况下,如果路径使用“/”来结尾,则只复制目录里的内容,如果没有使用“/”来结尾,则包含目录在内的整个内容全部复制,类似于rsync

示例:

①对web主机组的主机创建/tmp/test.ansible文件,内容为hello\nworld,权限为666

  ansible web -m copy -a 'content="hello\nworld" dest=/tmp/test.ansible mode=666'

②拷贝本机的图片到对应主机组中主机的/data/photo,权限为644,且覆盖之前备份:

ansible web -m copy -a 'src=/root/2345_image_file_copy_2.jpg dest=/data/photo mode=644 backup=yes'


4、file 设置文件属性:

创建目录:-a “path= state=directory

创建链接文件:-a “path= src= state=link

删除文件:-a “path= state=absent

参数使用:

force:需要在两种情况下强制创建软链接,一种是源文件不存在,但之后会建立的情况下;另一种是目标软链接已存在,需要先取消之前的软链,然后创建新的软链,有两个选项:yes|no代表是否强制创建

group:定义文件/目录的属组

mode:定义文件/目录的权限

owner:定义文件/目录的属主

path:必选项,定义文件/目录的路径

recurse:递归设置文件的属性,只对目录有效

src:被链接的源文件路径,只应用于state=link的情况

dest:被链接到的路径,只应用于state=link的情况

state:

directory:如果目录不存在,就创建目录

file:即使文件不存在,也不会被创建

link:创建软链接

hard:创建硬链接

touch:如果文件不存在,则会创建一个新的文件,如果文件或目录已存在,则更新其最后修改时间

absent:删除目录、文件或者取消链接文件

示例:

ansible web -m file -a 'path=/data/webapp state=directory'  创建目录

  运维自动化之ansible_第4张图片

ansible web -m file -a 'path=/data/webapp state=absent'     删除目录

 运维自动化之ansible_第5张图片

ansible web -m file -a 'path=/data/img src=/data/photo state=link'   创建软链接

ansible web -m file -a 'dest=/data/img2 src=/data/photo state=link'   创建软链接

 图片1.png

ansible web -m file -a 'path=/data/haha state=touch'  创建文件


5、fetch 从远程某主机获取文件到本地:

dest:用来存放文件的目录

例如存放目录为backup,源文件名称为/etc/profile,在主机pythonserver中,那么保存为/backup/pythonserver/etc/profile

Src:在远程拉取的文件,并且必须是一个file,不能是目录

示例:

ansible web -m fetch -a 'src=/data/photo dest=/data/photo' 

运维自动化之ansible_第6张图片 


6、cron 管理cron计划任务:

-a “”: 设置管理节点生成定时任务

action:

   cron backup= # 如果设置,则根据其值(yes|no)确定是否创建一个crontab备份

  cron_file= #如果指定, 使用这个文件cron.d,而不是单个用户

   day= #应该运行的工作日( 1-31, *, */2)

   hour= # 小时 ( 0-23, *, */2 )

   minute= #分钟( 0-59, *, */2 )

   month= # 月( 1-12, *, /2 )

   weekday # 周 ( 0-6 for Sunday-Saturday,, )

   job= #指明运行的命令是什么

   name= #定时任务描述

   reboot # 任务在重启时运行,不建议使用,建议使用special_time

   special_time #特殊的时间范围,参数:reboot(重启时),annually(每年),monthly(每月),weekly(每周),daily(每天),hourly(每小时)

   state #指定状态,present表示添加定时任务,也是默认设置。absent 表示删除定时任务

   user # 以哪个用户的身份执行

示例:每天同步一次时间:

ansible web -m cron -a 'name="ntp" special_time=daily job="/sbin/ntpdate 172.17.0.1 &>/dev/null"'  

每五分钟同步一次时间:

ansible web -m cron -a 'name="ntp update" minute="*/5" job="/sbin/ntpdate 172.17.0.1 &>/dev/null"'

web主机组对应的主机查看计划任务

blob.png 

ansible web -m cron -a 'name="ntp update" minute="*/5" job="/sbin/ntpdate 172.17.0.1 &>/dev/null" state=absent'  删除计划任务


7、yum 安装软件

conf_file #设定远程yum安装时所依赖的配置文件。

disable_gpg_check #是否禁止GPG checking,只用于`presentor `latest’。

disablerepo #临时禁止使用yum库。 只用于安装或更新时。

enablerepo #临时使用的yum库。只用于安装或更新时。

name= #所安装的包的名称,可以是软件,也可以是rpm

state= #present安装, latest安装最新的, absent 卸载软件。

update_cache #强制更新yum的缓存。

示例:

ansible web -m yum -a 'name=htop state=present disable_gpg_check=yes'  安装htop

ansible web -m yum -a 'name=htop state=absent disable_gpg_check=yes'  卸载htop

 运维自动化之ansible_第7张图片

运维自动化之ansible_第8张图片 


8、service: 服务程序管理

arguments #命令行提供额外的参数

enabled #设置开机启动,true|falseyes|no

name= #服务名称

runlevel #开机启动的级别,一般不用指定。

sleep #在重启服务的过程中,是否等待。如sleep 2在服务关闭以后等待2秒再启动。

state #started启动服务, stopped停止服务, restarted重启服务, reloaded重载配置

示例:启动nginx服务并设置开机自启动:

  ansible web -m service -a 'name=nginx state=started enabled=true'

    重启nginx服务,在服务关闭两秒后再启动:

ansible web -m service -a 'name=nginx state=restarted sleep=2s'


9、user 用户模块,管理用户帐号action: user

comment # 用户的描述信息

createhome # 是否创建家目录

force # 在使用state=absent, 行为与userdel force一致.

group # 指定基本组

groups # 指定附加组,如果指定为(groups=)表示删除所有组

home # 指定用户家目录

move_home # 如果设置为home=, 试图将用户主目录移动到指定的目录

name # 指定用户名

non_unique # 该选项允许改变非唯一的用户ID

password # 指定用户密码.指定完之后使用openssh加密,将加密密码写进/etc/shadow

remove # 在使用state=absent, 行为与userdel remove一致

shell # 指定默认shell

state # 设置帐号状态,不指定为创建,指定值为absent表示删除

system # 当创建一个用户,设置这个用户是系统用户。这个设置不能更改现有用户

uid # 指定用户的uid

示例:创建用户tom,密码123456uid1066,默认shell/bin/bash

ansible web -m user -a 'name=tom password=123456 uid=1066 shell=/bin/bash'

创建用户tom并指明uid,主组,附加组,默认shell,家目录

ansible web -m user -a 'name=tom comment="tom is tom" uid=1066 group=tom groups=wheel

shell=/bin/zshell home=/home/tomhome'


10、group  用户组模块,添加或删除组

action: group

gid # 设置组的GID

name= # 管理组的名称

state # 指定组状态,默认为创建,设置值为absent为删除

system # 设置值为yes,表示为创建系统组

示例:创建名为tom的组

ansible web -m group -a 'name=tom state=present'


11、script 在指定节点运行服务端的脚本

vim test.sh

#/bin/bash

touch /tmp/test.sh.log

echo “hello>> /tmp/test.sh.log

加执行权限:chmod +x test.sh

执行:ansible web -m script -a ‘/root/test.sh’

查看效果:ansible web -m shell -a ‘cat /tmp/test.sh.log

blob.png 


12、setup模块

   facts组件是Ansible用于采集被管机器设备信息的一个功能,我们可以使用setup模块查机器的所有facts信息,可以使用filter来查看指定信息。整个facts信息被包装在一个JSON格式的数据结构中,ansible_facts是最上层的值。

   facts就是变量,内建变量 。每个主机的各种信息,cpu颗数、内存大小等。会存在facts中的某个变量中。调用后返回很多对应主机的信息,在后面的操作中可以根据不同的信息来做不同的操作。如redhat系列用yum安装,而debian系列用apt来安装软件。

   setup模块,主要用于获取主机信息,在playbooks里经常会用到的一个参数gather_facts就与该模块相关。setup模块下经常使用的一个参数是filter参数。

示例:

ansible web -m setup 获取web主机组里主机的所有信息

ansible web -m setup -a 'filter=ansible_*_mb' //查看主机内存信息

ansible web -m setup -a 'filter=ansible_eth[0-2]' //查看接口为eth0-2的网卡信息

ansible all -m setup --tree /tmp/facts //将所有主机的信息输入到/tmp/facts目录下,每台主机的信息输入到对应主机名文件中(/etc/ansible/hosts里的主机名)

 blob.png

项目总结:

以上都是命令行式的操作,操作比较繁琐,而且不容易排错与维护,所以我们可以使用Ansible playbook来实现。具体用法参看博客:https://blog.51cto.com/13150617/2048228