day38-day39 ansible自动化批量管理

SSH批量管理项目如何一键一秒钟完成:一秒完成。

 

1.ssh-keygen非交互式创建秘钥对:

具体命令:ssh-keygen -f ~/.ssh/id_rsa  -P '' -q

参数讲解:

ssh-keygen:密钥对创建工具

[-P  old_passphrase]密码

[-f output_keyfile]输出的秘钥文件

[-q]不输出信息      

[-t dsa ]指定秘钥类型。


这样写不输出任何内容

2.ssh-copy-id不需要提示yes/no分发秘钥  不提示yes/no但是需要输密码

具体命令:ssh-copy-id -f -i ~/.ssh/id_rsa.pub -o StrictHostKeyChecking=no 172.16.1.8


参数讲解:

ssh-copy-id  -f   -i ~/.ssh/id_rsa.pub -o StrictHostKeyChecking=no root172.16.1.8

ssh-copy-id [-f] [-i [identity_file]] [-p port] [[-o ] ...] [user@]hostname

说明:

-f: force mode强制

[-i [identity_file]]指定秘钥文件

[[-o ] ...]指定ssh参数选项。

StrictHostKeyChecking=no自动信任主机并添加到known_hosts文件

3.sshpass工具:指定密码非人工交互分发秘钥 不提示yes/no也不需要输密码

sshpass -p123456 ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.7

 

[root@web02 ~]# sshpass -help查看帮助

Usage: sshpass [-f|-d|-p|-e] [-hV] command parameters

sshpass -p123456 ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.7

sshpass [-f|-d|-p|-e] [-hV] command parameters


参数讲解:

-p   password   Provide password as argument (security unwise)    #指定用户密码操作

-o  StrictHostKeyChecking=no           自动信任主机并添加到known_hosts文件

 

4.一键配置实践


(1)把web02作为分发服务器:

web02(8)-->m01(61)

web02(8)-->web01(7)


ssh-keygen -f ~/.ssh/id_rsa  -P '' -q   创建秘钥对

ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.7分发公钥需要输密码

sshpass -p123456 ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.7

分发公钥不需要需要输密码

上面两种方法而选一

2)也可以用脚本来做

#!/bin/bash

#yum install sshpass -y

ssh-keygen -f ~/.ssh/id_rsa  -P '' -q

for ip in 7 61

do

  sshpass -p123456 ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.$ip

done

3)测试效果

ssh 172.16.1.7 "ifconfig eth0"

ssh 172.16.1.61 "ifconfig eth0"


Ansible自动化管理




1.ansible介绍


ssh秘钥认证+脚本批量管理,特点:简单、实用,

但是看起来比较LOW,需要人工写脚本,类似实时复制的inotify工具。

2013以前这种方式很普遍。

MySQL高可用 MHA集群,要求所有机器互相秘钥认证。

大数据集群也需要。


 

2.批量管理工具历史

SSH+脚本 CFEngine、Puppet、saltstack               、ansible

08年以前 07-08年   10-13年  14-17(python开发)      16-(python开发)

sina网

3.为什么用ansible?

简单、方便、容易学习、功能同样强大。

ansible有配置文件,可以多线程直接实现。不需要写脚本,类似实时复制的sersync。



4.什么是ansible?

Ansible是一个用来远程管理服务器的工具软件。

Ansible是一个用来批量部署远程主机上服务的工具。这里“远程主机(Remote Host)”是指任

何可以通过SSH登录的主机,所以它既可以是远程虚拟机或物理机,也可以是本地主机。


Ansible通过SSH协议实现管理节点与远程节点之间的通信。理论上来说,只要能通过SSH登录到

远程主机来完成的操作,都可以通过Ansible实现批量自动化操作。

涉及管理操作:复制文件、安装服务、服务启动停止管理、配置管理等等。



5.为什么要用批量管理工具运维?

提高效率,百度几万台服务器,阿里几十万台服务器。

如何省钱?

SSD+SATA热点存储 15 15 7


 

6.Ansible特点

Ansible基于Python语言实现,由Paramiko和PyYAML两个关键模块构建。


Shell、Python是Linux运维学员必会的两门语言。


1)安装部署过程特别简单,学习曲线很平坦。

2)不需要单独安装客户端,只是利用现有的SSHD服务(协议)即可。

3)不需要服务端(no servers)。

4)ansible playbook,采用yaml配置,提前编排自动化任务。

5)ansible功能模块较多,对于自动化的场景支持丰富。


官方:http://docs.ansible.com



7.Ansible架构介绍(见图说明)暂时没图周六周日找

1、连接插件connectior plugins用于连接主机 用来连接被管理端

2、核心模块 core modules 连接主机实现操作, 它依赖于具体的模块来做具体的事情

3、自定义模块 custom modules,根据自己的需求编写具体的模块

4、插件 plugins,完成模块功能的补充

5、剧本 playbooks,ansible的配置文件,将多个任务定义在剧本中,由ansible自动执行

6、主机清单 inventor,定义ansible需要操作主机的范围

最重要的一点是ansible是模块化的 它所有的操作都依赖于模块

(懂Python可以二次开发)

上面是理论

下面是实际


1.ansible实践环境准备

61(m01)====>31(nfs01)

61(m01) ====>41(backup)




2.安装ansible

m01管理机:

yum install epel-release -y安装epel源

yum install ansible -y安装ansible

 

#如果有libselinux-python就不执行下面的命令了。

#rpm -qa |grep libselinux-python  ansible的依赖包必须装

#yum install libselinux-python -y

 

其他所有机器:

#rpm -qa |grep libselinux-python  其他机器都要装

#yum install libselinux-python -y


3.主机列表配置

ssh列表实现方法:

for n  in 7 8

do

 echo 172.16.1.$n

done


/etc/ansible/hosts主机资产清单文件,用于定义被管理主机的认证信息,

例如ssh登录用户名、密码以及key相关信息。如何配置Inventory文件

1.主机支持主机名通配以及正则表达式,例如web[1:3].oldboy.com代表三台主机

2.主机支持基于非标准的ssh端口,例如web1.oldboyedu.com:6666

3.主机支持指定变量,可对个别主机的特殊配置,如登陆用户\密码

4.主机组支持指定变量[group_name:vars],同时支持嵌套组[game:children]



4环境搭建完毕

实践:

cp /etc/ansible/hosts{,.ori}先备份

cat >/etc/ansible/hosts<

[oldboy]

172.16.1.31

172.16.1.41


[oldgirl]

172.16.1.31

172.16.1.41

172.16.1.51

EOF

cat /etc/ansible/hosts



/etc/ansible/ansible.cfg #ansible的配置文件可以对模块来批量管理比如oldboy下面的几台服务,可以指定多个模块。


如果没有做SSH秘钥认证,可以把用户名密码写到

/etc/ansible/hosts


[oldboy_pass]

172.16.1.7 ansible_ssh_user=root ansible_ssh_pass=123456

172.16.1.8 ansible_ssh_user=root ansible_ssh_pass=123456


特殊端口: 

[oldboy]

172.16.1.7  ansible_port=52113  ansible_user=root ansible_ssh_pass=123456

172.16.1.8  ansible_port=52113  ansible_user=root ansible_ssh_pass=123456

                端口用户密码

5.小试牛刀


直接执行如下命令

ansible oldboy -m command -a "free -m"  基于SSH秘钥认证的前提下,如果没有秘钥就绪要密码和用户上面没有必须有一个,没有就会报错秘钥上面已经配置完成



 

要想成功,还需要解绝yes/no的问题。  

为什么要解决,因为批量管理的话需要密码和确认的,确认就一次

不想确认先连接一下。

1、ssh连接一遍。

2、ssh -o 参数

 

上述命令就是sshpass的封装

或者改配置文件vim /ansible/ansible.cfg

==========================================

ansible关闭ssh首次连接时yes/no提示

使用ssh连接时,可以使用-o参数将StrictHostKeyChecking设置为no,

避免使用ssh连接时避免首次连接时让输入yes/no部分的提示。




方法1:修改 /etc/ansible/ansible.cfg中的374行

374行改为:

ssh_args = -o ControlMaster=auto -o ControlPersist=60s -o StrictHostKeyChecking=no


方法2:修改 /etc/ansible/ansible.cfg中的71行

 70 # uncomment this to disable SSH key host checking

 71 #host_key_checking = False


71行的注释取消:host_key_checking = False

 

验证可以了

[root@m01 ~]# ansible oldboy_pass -m command -a "free -m"

172.16.1.7 | CHANGED | rc=0 >>

              total        used        free      shared  buff/cache   available

Mem:            972          69         807           7          95         771

Swap:           767           0         767


172.16.1.31 | CHANGED | rc=0 >>

              total        used        free      shared  buff/cache   available

Mem:            972          71         804           7          96         768

Swap:           767           0         767


 

小项目实践

 

1.基于SSH秘钥认证的实践

一键创建及分发秘钥:

#!/bin/bash

ssh-keygen -f ~/.ssh/id_rsa  -P '' -q

for ip in 7 8 41 31

do

  sshpass -p123456 ssh-copy-id -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.$ip

done

脚本给7 8 41 31发公钥

 

[root@m01 ~]# cat /etc/ansible/hosts配置模块oldboy

[oldboy]

172.16.1.31

172.16.1.41

172.16.1.7


2设置不确认  yes/no

 


方法1:修改 /etc/ansible/ansible.cfg中的374行

374行改为:

ssh_args = -o ControlMaster=auto -o ControlPersist=60s -o StrictHostKeyChecking=no


方法2:修改 /etc/ansible/ansible.cfg中的71行

 70 # uncomment this to disable SSH key host checking

 71 #host_key_checking = False

 

验证

[root@m01 ~]# ansible oldboy_pass -m command -a "free -m"

 

 

 

 

 

[root@m01 ~]# ansible oldboy -m command -a "free -m" #和前面sh cmd.sh "free -m"

解释:

Oldnoy模块也可以理解成组

-m  command模块             

-a加双引号里面是要执行的命令

 

 

.ansible命令参数

-m MODULE_NAME,                    模块名字,默认command

-a MODULE_ARGS,    块参数

-f FORKS                              并发进程数,默认5个。

-i INVENTORY(default=/etc/ansible/hosts) 指定主机列表文件

===================

ansible

ansible-doc

ansible-playbook

ansible-galaxy

===================

 

12.ansible模块查看和帮助*****

 

查找模块

ansible-doc -l          #模块就Linux命令了。


查看某个模块的具体参数帮助

ansible-doc -s command  #Linux命令参数

 

12.1 command模块 *****

 

1)功能说明:

command  Executes a command on a remote node

功能说明:执行一个命令在远程节点上

操作实践:

ansible oldboy -m command -a "free -m"

ansible oldboy -m command -a "df -h"

ansible oldboy -m command -a "ls /root"

ansible oldboy -m command -a "cat redhat-release"

ansible oldboy -m command -a "cat /etc/redhat-release"

最通用的功能。

 

[root@m01 ~]# ansible oldboy -m command -a "cat /etc/redhat-release"

172.16.1.7 | CHANGED | rc=0 >>

CentOS Linux release 7.6.1810 (Core)


172.16.1.31 | CHANGED | rc=0 >>

CentOS Linux release 7.6.1810 (Core)


172.16.1.41 | CHANGED | rc=0 >>

CentOS Linux release 7.6.1810 (Core)


[root@m01 ~]# cat /server/scripts/cmd.sh

for n in 31 41

do

   echo "=====172.16.1.$n======"

   ssh 172.16.1.$n "$1"

done

[root@m01 ~]# sh /server/scripts/cmd.sh "cat /etc/redhat-release"

=====172.16.1.31======

CentOS Linux release 7.6.1810 (Core)

=====172.16.1.41======

CentOS Linux release 7.6.1810 (Core)


 

特殊:不支持的东西,例如> < | &等 $HOME,替代方案用shell模块

ansible oldboy -m shell -a "ps -ef|grep ssh"

ansible oldboy -m shell -a "echo oldboy >/tmp/a.log"

 

 

 

 

 

 

 

 

 

 

 


参数:chdir=/tmp配置相当于cd /tmp

[root@m01 ~]# ansible oldboy  -m command -a "pwd chdir=/etc"

ansible oldboy  -m shell -a "cd /etc/;pwd"


参数:creates=/etc相当于条件测试  [ -e /etc ]||pwd 和下面removes相反

[root@m01 ~]# ansible oldboy  -m command -a "pwd creates=/etc"


参数:removes=/root相当于条件测试 [ -e /root ]&&ls /root

ansible oldboy  -m command -a "ls /root removes=/root"

ansible oldboy  -m shell -a "[ -d /etc ]||pwd"

[root@m01 ~]# ansible oldboy  -m command -a "cat /etc/hosts removes=/etc/hosts"

参数:warn=False忽略警告

[root@m01 ~]# ansible oldboy  -m command -a "chmod 000 /etc/hosts warn=False"

ansible 模块的作用

模块                作用

command        执行命令

shell                 执行命令(支持管道符)

yum                  安装软件模块

copy                  配置模块

service             启动服务模块

user                  用户管理

file                     创建目录,创建文件,往文件写内容

cron                   定时任务

mount                挂载


12.2 shell模块功能说明:

功能说明:执行一个命令在远程节点上

shell  Execute commands in nodes.

官方链接:http://docs.ansible.com/ansible/latest/shell_module.html

 

实践:增加文本文件

[root@m01 ~]# ansible oldboy -m shell -a "echo oldboy >/tmp/tmp.txt"

172.16.1.41 | CHANGED | rc=0 >>

172.16.1.31 | CHANGED | rc=0 >>



[root@m01 ~]# ansible oldboy -m shell -a "cat /tmp/tmp.txt"  

172.16.1.41 | CHANGED | rc=0 >>

oldboy

172.16.1.31 | CHANGED | rc=0 >>

Oldboy





要执行的脚本必须在远程机器上存在:

[root@m01 ~]# ansible oldboy -m shell -a "sh /server/scripts/bak.sh"

172.16.1.41 | FAILED | rc=127 >>

sh: /server/scripts/bak.sh:没有那个文件或目录non-zero return code

172.16.1.31 | CHANGED | rc=0 >>

 

12.4 copy模块功能说明:

功能说明:复制文件到远程主机

官方链接:http://docs.ansible.com/ansible/latest/copy_module.html

参数说明:



Copy模块  

src — 推送数据的源文件信息

dest — 推送数据的目标路径backup — 对推送传输过去的文件,进行备份content — 直接批量在被管理端文件中添加内容group — 将本地文件推送到远端,指定文件属组信息owner — 将本地文件推送到远端,指定文件属主信息mode — 将本地文件推送到远端,指定文件权限信息force — 分为force=no或yes,如果目标主机包含该文件,但内容不同,设置为yes,则强制覆盖,如果为no,则只有当目标主机的目标位置不存在该文件时,才复制。默认为yes


实践1:把/etc/hosts拷贝到/opt下,权限设置400,用户和组设置root

ansible oldboy -m copy -a "src=/etc/hosts dest=/opt mode=0400 owner=root group=root backup=yes"


实践2:把/etc/passwd拷贝/tmp下改名为oldgirl,用户和组为oldboy,权限600,如果有存在同名文件覆盖


ansible oldboy -m copy -a "src=/etc/passwd dest=/tmp/oldgirl.txt owner=oldboy group=oldboy mode=0600 force=yes"



批量分发host需求,操作前备份

ansible oldboy -m copy -a "src=/etc/hosts dest=/etc/hosts mode=0644 owner=root group=root

backup=yes"


分发脚本,给他执行权限

ansible oldboy -m copy -a "src=/server/scripts/bak.sh dest=/server/scripts/ mode=ugo+x"


完事去检查

 

12.3  script模块功能说明:

功能说明:远程节点上运行本地脚本模块

官方链接:http://docs.ansible.com/ansible/latest/script_module.html

参数说明:


本地脚本,在远端执行。

[root@m01 /server/scripts]# ansible oldboy -m script -a "/server/scripts/new.sh"



12.5 file模块功能说明:

功能说明:设置文件属性

官方链接:http://docs.ansible.com/ansible/latest/copy_module.html

path — 指定远程主机目录或文件信息recurse — 递归授权state —directory — 在远端创建目录touch — 在远端创建文件link — link或hard表示创建链接文件absent — 表示删除文件或目录mode — 设置文件或目录权限owner — 设置文件或目录属主信息group — 设置文件或目录属组信息                           

 

 

 

 

参数实践:创建数据文件(普通文件目录软链接文件)

ansible oldboy -m file -a "dest=/tmp/oldboy_dir state=directory"

ansible oldboy -m command -a "mkdir -p /tmp/oldboy_dir1 warn=false"

 

ansible oldboy -m file -a "dest=/tmp/oldboy1 state=touch"

ansible oldboy -m command -a "touch /tmp/oldboy_file1.txt warn=false"

 

================================================================

替代方案:

ansible oldboy  -m command -a "chmod 777 /etc/hosts warn=false"

ansible oldboy  -m command -a "chmod 644 /etc/hosts warn=false"

ansible oldboy  -m command -a "chown oldboy /etc/hosts warn=false"

ansible oldboy  -m command -a "chown root /etc/hosts warn=false"

 

 

 

 

 

 

 

 

创建目录:mkdir /tmp/oldboy_dir

ansible oldboy -m file -a "dest=/tmp/oldboy_dir state=directory"

 

递归设置权限:

ansible oldboy -m file -a "dest=/tmp/oldboy_dir state=directory mode=644 recurse=yes"

 

创建文件:touch /tmp/oldboy_file

ansible oldboy -m file -a "dest=/tmp/oldboy_file state=touch"

 

删除文件:rm -f /tmp/oldboy_file

ansible oldboy -m file -a "dest=/tmp/oldboy_file state=absent"

 

创建链接文件:ln -s /etc/hosts /tmp/link_file

ansible oldboy -m file -a "src=/etc/hosts dest=/tmp/link_file state=link"

 

ansible oldboy -m file -a "dest=/tmp/oldboy_file state=touch owner=oldboy group=oldboy mode=000"

ansible oldboy -m file -a "dest=/tmp/oldboy_file state=touch owner=oldboy group=oldboy mode=ugo=rwx"

 

作业:批量创建5个用户oldboy01-05,然后设置123456密码,然后同时在所有客户端执行









12.6 yum模块功能说明:

功能说明:yum包管理模块

官方链接:http://docs.ansible.com/ansible/latest/yum_module.html

name    ---指定要安装的软件包名称

state   ---指定使用yum的方法

installed,present   ---安装软件包

removed,absent      ---移除软件包

latest               ---安装最新软件包


ansible oldboy  -m command -a "yum install nginx -y"


ansible oldboy -m yum -a "name=nginx state=installed"


ansible oldboy -m yum -a "name=nc state=installed"



[root@nfs01 oldboy_dir]# rpm -qa nginx

nginx-1.10.2-1.el6.x86_64


###不要用yum卸载,可用rpm -e卸载。




ansible系统类型模块说明

12.7 systemd模块功能说明:(service模块)

功能说明:yum包管理模块

官方链接:http://docs.ansible.com/ansible/latest/service_module.html

参数说明:


service nfs restart

/etc/init.d/nfs restart

systemctl restart nfs

State=动作要干什么

Name=名字

Enabled=no要不要开机自启no是不开启  yes是开启


实践:

ansible oldboy -m systemd -a "name=crond.service enabled=no state=stopped "

ansible oldboy -m command -a "systemctl status crond"

ansible oldboy -m systemd -a "name=crond.service enabled=yes state=started"


百度ansible systemd

https://hoxis.github.io/ansible-system-modules.html

https://www.cnblogs.com/mcsiberiawolf/articles/10083626.html


[root@backup ~]# service crond restart

Redirecting to /bin/systemctl restart crond.service

    

#service模块功能说明:

功能说明:启动停止服务

官方链接:http://docs.ansible.com/ansible/latest/service_module.html


#相当于

#service crond stop|/etc/init.d/crond stop

#chkconfig crond off

ansible oldboy -m service -a "name=crond state=stop enabled=no"


#相当于/etc/init.d/crond start

chkconfig crond on

ansible oldboy -m service -a "name=crond state=started enabled=yes"


ansible oldboy -m command -a "name=crond state=started enabled=yes"





 

12.8 cron模块功能说明:

功能说明:管理定时任务条目信息模块

cron     Manage cron.d and crontab entries

官方链接:http://docs.ansible.com/ansible/latest/cron_module.html


定时任务格式:

* * * * * CMD


创建定时任务:

ansible oldboy -m cron -a "name='sync time' minute=00 hour=00 job='/usr/sbin/ntpdate time.nist.gov >/dev/null 2>&1'"


[root@backup ~]# crontab -l

#crond-id-001:time sync by oldboy

*/5 * * * * /usr/sbin/ntpdate ntp3.aliyun.com >/dev/null 2>&1


#Ansible: sync time

00 00 * * * /usr/sbin/ntpdate time.nist.gov >/dev/null 2>&1



结果:

#Ansible: sync time

00 00 * * * /usr/sbin/ntpdate time.nist.gov >/dev/null 2>&1


添加如下定时任务:

05 03 * * * /bin/sh /server/scripts/backup.sh >/dev/null 2>&1


命令如下:

ansible oldboy -m cron -a "name='backup data' minute=05 hour=03 job='/bin/sh /server/scripts/backup.sh >/dev/null 2>&1'"


结果:

#Ansible: backup data

05 03 * * * /bin/sh /server/scripts/backup.sh /server/scripts/list >/dev/null 2>&1


删除定时任务:state=absent backup=yes

ansible oldboy -m cron -a "name='backup data' state=absent backup=yes"


名字不变的前提下,修改ansible参数内容,就是修改定时任务。

你可能感兴趣的:(day38-day39 ansible自动化批量管理)