SSH批量管理项目如何一键一秒钟完成:一秒完成。
1.ssh-keygen非交互式创建秘钥对:
具体命令:ssh-keygen -f ~/.ssh/id_rsa -P '' -q
参数讲解:
ssh-keygen:密钥对创建工具
[-P old_passphrase]密码
[-f output_keyfile]输出的秘钥文件
[-q]不输出信息
[-t dsa ]指定秘钥类型。
这样写不输出任何内容
2.ssh-copy-id不需要提示yes/no分发秘钥 不提示yes/no但是需要输密码
具体命令:ssh-copy-id -f -i ~/.ssh/id_rsa.pub -o StrictHostKeyChecking=no 172.16.1.8
参数讲解:
ssh-copy-id -f -i ~/.ssh/id_rsa.pub -o StrictHostKeyChecking=no root172.16.1.8
ssh-copy-id [-f] [-i [identity_file]] [-p port] [[-o
说明:
-f: force mode强制
[-i [identity_file]]指定秘钥文件
[[-o ] ...]指定ssh参数选项。
StrictHostKeyChecking=no自动信任主机并添加到known_hosts文件
3.sshpass工具:指定密码非人工交互分发秘钥 不提示yes/no也不需要输密码
sshpass -p123456 ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.7
[root@web02 ~]# sshpass -help查看帮助
Usage: sshpass [-f|-d|-p|-e] [-hV] command parameters
sshpass -p123456 ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.7
sshpass [-f|-d|-p|-e] [-hV] command parameters
参数讲解:
-p password Provide password as argument (security unwise) #指定用户密码操作
-o StrictHostKeyChecking=no 自动信任主机并添加到known_hosts文件
4.一键配置实践
(1)把web02作为分发服务器:
web02(8)-->m01(61)
web02(8)-->web01(7)
ssh-keygen -f ~/.ssh/id_rsa -P '' -q 创建秘钥对
ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.7分发公钥需要输密码
sshpass -p123456 ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.7
分发公钥不需要需要输密码
上面两种方法而选一
(2)也可以用脚本来做
#!/bin/bash
#yum install sshpass -y
ssh-keygen -f ~/.ssh/id_rsa -P '' -q
for ip in 7 61
do
sshpass -p123456 ssh-copy-id -f -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.$ip
done
(3)测试效果
ssh 172.16.1.7 "ifconfig eth0"
ssh 172.16.1.61 "ifconfig eth0"
Ansible自动化管理
1.ansible介绍
ssh秘钥认证+脚本批量管理,特点:简单、实用,
但是看起来比较LOW,需要人工写脚本,类似实时复制的inotify工具。
2013以前这种方式很普遍。
MySQL高可用 MHA集群,要求所有机器互相秘钥认证。
大数据集群也需要。
2.批量管理工具历史
SSH+脚本 CFEngine、Puppet、saltstack 、ansible
08年以前 07-08年 10-13年 14-17(python开发) 16-(python开发)
sina网
3.为什么用ansible?
简单、方便、容易学习、功能同样强大。
ansible有配置文件,可以多线程直接实现。不需要写脚本,类似实时复制的sersync。
4.什么是ansible?
Ansible是一个用来远程管理服务器的工具软件。
Ansible是一个用来批量部署远程主机上服务的工具。这里“远程主机(Remote Host)”是指任
何可以通过SSH登录的主机,所以它既可以是远程虚拟机或物理机,也可以是本地主机。
Ansible通过SSH协议实现管理节点与远程节点之间的通信。理论上来说,只要能通过SSH登录到
远程主机来完成的操作,都可以通过Ansible实现批量自动化操作。
涉及管理操作:复制文件、安装服务、服务启动停止管理、配置管理等等。
5.为什么要用批量管理工具运维?
提高效率,百度几万台服务器,阿里几十万台服务器。
如何省钱?
SSD+SATA热点存储 15 15 7
6.Ansible特点
Ansible基于Python语言实现,由Paramiko和PyYAML两个关键模块构建。
Shell、Python是Linux运维学员必会的两门语言。
1)安装部署过程特别简单,学习曲线很平坦。
2)不需要单独安装客户端,只是利用现有的SSHD服务(协议)即可。
3)不需要服务端(no servers)。
4)ansible playbook,采用yaml配置,提前编排自动化任务。
5)ansible功能模块较多,对于自动化的场景支持丰富。
官方:http://docs.ansible.com
7.Ansible架构介绍(见图说明)暂时没图周六周日找
1、连接插件connectior plugins用于连接主机 用来连接被管理端
2、核心模块 core modules 连接主机实现操作, 它依赖于具体的模块来做具体的事情
3、自定义模块 custom modules,根据自己的需求编写具体的模块
4、插件 plugins,完成模块功能的补充
5、剧本 playbooks,ansible的配置文件,将多个任务定义在剧本中,由ansible自动执行
6、主机清单 inventor,定义ansible需要操作主机的范围
最重要的一点是ansible是模块化的 它所有的操作都依赖于模块
(懂Python可以二次开发)
上面是理论
下面是实际
1.ansible实践环境准备
61(m01)====>31(nfs01)
61(m01) ====>41(backup)
2.安装ansible
m01管理机:
yum install epel-release -y安装epel源
yum install ansible -y安装ansible
#如果有libselinux-python就不执行下面的命令了。
#rpm -qa |grep libselinux-python ansible的依赖包必须装
#yum install libselinux-python -y
其他所有机器:
#rpm -qa |grep libselinux-python 其他机器都要装
#yum install libselinux-python -y
3.主机列表配置
ssh列表实现方法:
for n in 7 8
do
echo 172.16.1.$n
done
/etc/ansible/hosts主机资产清单文件,用于定义被管理主机的认证信息,
例如ssh登录用户名、密码以及key相关信息。如何配置Inventory文件
1.主机支持主机名通配以及正则表达式,例如web[1:3].oldboy.com代表三台主机
2.主机支持基于非标准的ssh端口,例如web1.oldboyedu.com:6666
3.主机支持指定变量,可对个别主机的特殊配置,如登陆用户\密码
4.主机组支持指定变量[group_name:vars],同时支持嵌套组[game:children]
4环境搭建完毕
实践:
cp /etc/ansible/hosts{,.ori}先备份
cat >/etc/ansible/hosts< [oldboy] 172.16.1.31 172.16.1.41 [oldgirl] 172.16.1.31 172.16.1.41 172.16.1.51 EOF cat /etc/ansible/hosts /etc/ansible/ansible.cfg #ansible的配置文件可以对模块来批量管理比如oldboy下面的几台服务,可以指定多个模块。 如果没有做SSH秘钥认证,可以把用户名密码写到 /etc/ansible/hosts [oldboy_pass] 172.16.1.7 ansible_ssh_user=root ansible_ssh_pass=123456 172.16.1.8 ansible_ssh_user=root ansible_ssh_pass=123456 特殊端口: [oldboy] 172.16.1.7 ansible_port=52113 ansible_user=root ansible_ssh_pass=123456 172.16.1.8 ansible_port=52113 ansible_user=root ansible_ssh_pass=123456 端口用户密码 5.小试牛刀 直接执行如下命令 ansible oldboy -m command -a "free -m" 基于SSH秘钥认证的前提下,如果没有秘钥就绪要密码和用户上面没有必须有一个,没有就会报错秘钥上面已经配置完成 要想成功,还需要解绝yes/no的问题。 为什么要解决,因为批量管理的话需要密码和确认的,确认就一次 不想确认先连接一下。 1、ssh连接一遍。 2、ssh -o 参数 上述命令就是sshpass的封装 或者改配置文件vim /ansible/ansible.cfg ========================================== ansible关闭ssh首次连接时yes/no提示 使用ssh连接时,可以使用-o参数将StrictHostKeyChecking设置为no, 避免使用ssh连接时避免首次连接时让输入yes/no部分的提示。 方法1:修改 /etc/ansible/ansible.cfg中的374行 374行改为: ssh_args = -o ControlMaster=auto -o ControlPersist=60s -o StrictHostKeyChecking=no 方法2:修改 /etc/ansible/ansible.cfg中的71行 70 # uncomment this to disable SSH key host checking 71 #host_key_checking = False 71行的注释取消:host_key_checking = False 验证可以了 [root@m01 ~]# ansible oldboy_pass -m command -a "free -m" 172.16.1.7 | CHANGED | rc=0 >> total used free shared buff/cache available Mem: 972 69 807 7 95 771 Swap: 767 0 767 172.16.1.31 | CHANGED | rc=0 >> total used free shared buff/cache available Mem: 972 71 804 7 96 768 Swap: 767 0 767 小项目实践 1.基于SSH秘钥认证的实践 一键创建及分发秘钥: #!/bin/bash ssh-keygen -f ~/.ssh/id_rsa -P '' -q for ip in 7 8 41 31 do sshpass -p123456 ssh-copy-id -i ~/.ssh/id_rsa.pub "-o StrictHostKeyChecking=no" 172.16.1.$ip done 脚本给7 8 41 31发公钥 [root@m01 ~]# cat /etc/ansible/hosts配置模块oldboy [oldboy] 172.16.1.31 172.16.1.41 172.16.1.7 2设置不确认 yes/no 方法1:修改 /etc/ansible/ansible.cfg中的374行 374行改为: ssh_args = -o ControlMaster=auto -o ControlPersist=60s -o StrictHostKeyChecking=no 方法2:修改 /etc/ansible/ansible.cfg中的71行 70 # uncomment this to disable SSH key host checking 71 #host_key_checking = False 验证 [root@m01 ~]# ansible oldboy_pass -m command -a "free -m" [root@m01 ~]# ansible oldboy -m command -a "free -m" #和前面sh cmd.sh "free -m" 解释: Oldnoy模块也可以理解成组 -m command模块 -a加双引号里面是要执行的命令 .ansible命令参数 -m MODULE_NAME, 模块名字,默认command -a MODULE_ARGS, 模块参数 -f FORKS 并发进程数,默认5个。 -i INVENTORY(default=/etc/ansible/hosts) 指定主机列表文件 =================== ansible ansible-doc ansible-playbook ansible-galaxy =================== 12.ansible模块查看和帮助***** 查找模块 ansible-doc -l #模块就Linux命令了。 查看某个模块的具体参数帮助 ansible-doc -s command #Linux命令参数 12.1 command模块 ***** 1)功能说明: command Executes a command on a remote node 功能说明:执行一个命令在远程节点上 操作实践: ansible oldboy -m command -a "free -m" ansible oldboy -m command -a "df -h" ansible oldboy -m command -a "ls /root" ansible oldboy -m command -a "cat redhat-release" ansible oldboy -m command -a "cat /etc/redhat-release" 最通用的功能。 [root@m01 ~]# ansible oldboy -m command -a "cat /etc/redhat-release" 172.16.1.7 | CHANGED | rc=0 >> CentOS Linux release 7.6.1810 (Core) 172.16.1.31 | CHANGED | rc=0 >> CentOS Linux release 7.6.1810 (Core) 172.16.1.41 | CHANGED | rc=0 >> CentOS Linux release 7.6.1810 (Core) [root@m01 ~]# cat /server/scripts/cmd.sh for n in 31 41 do echo "=====172.16.1.$n======" ssh 172.16.1.$n "$1" done [root@m01 ~]# sh /server/scripts/cmd.sh "cat /etc/redhat-release" =====172.16.1.31====== CentOS Linux release 7.6.1810 (Core) =====172.16.1.41====== CentOS Linux release 7.6.1810 (Core) 特殊:不支持的东西,例如> < | &等 $HOME,替代方案用shell模块 ansible oldboy -m shell -a "ps -ef|grep ssh" ansible oldboy -m shell -a "echo oldboy >/tmp/a.log" 参数:chdir=/tmp配置相当于cd /tmp [root@m01 ~]# ansible oldboy -m command -a "pwd chdir=/etc" ansible oldboy -m shell -a "cd /etc/;pwd" 参数:creates=/etc相当于条件测试 [ -e /etc ]||pwd 和下面removes相反 [root@m01 ~]# ansible oldboy -m command -a "pwd creates=/etc" 参数:removes=/root相当于条件测试 [ -e /root ]&&ls /root ansible oldboy -m command -a "ls /root removes=/root" ansible oldboy -m shell -a "[ -d /etc ]||pwd" [root@m01 ~]# ansible oldboy -m command -a "cat /etc/hosts removes=/etc/hosts" 参数:warn=False忽略警告 [root@m01 ~]# ansible oldboy -m command -a "chmod 000 /etc/hosts warn=False" ansible 模块的作用 模块 作用 command 执行命令 shell 执行命令(支持管道符) yum 安装软件模块 copy 配置模块 service 启动服务模块 user 用户管理 file 创建目录,创建文件,往文件写内容 cron 定时任务 mount 挂载 12.2 shell模块功能说明: 功能说明:执行一个命令在远程节点上 shell Execute commands in nodes. 官方链接:http://docs.ansible.com/ansible/latest/shell_module.html 实践:增加文本文件 [root@m01 ~]# ansible oldboy -m shell -a "echo oldboy >/tmp/tmp.txt" 172.16.1.41 | CHANGED | rc=0 >> 172.16.1.31 | CHANGED | rc=0 >> [root@m01 ~]# ansible oldboy -m shell -a "cat /tmp/tmp.txt" 172.16.1.41 | CHANGED | rc=0 >> oldboy 172.16.1.31 | CHANGED | rc=0 >> Oldboy 要执行的脚本必须在远程机器上存在: [root@m01 ~]# ansible oldboy -m shell -a "sh /server/scripts/bak.sh" 172.16.1.41 | FAILED | rc=127 >> sh: /server/scripts/bak.sh:没有那个文件或目录non-zero return code 172.16.1.31 | CHANGED | rc=0 >> 12.4 copy模块功能说明: 功能说明:复制文件到远程主机 官方链接:http://docs.ansible.com/ansible/latest/copy_module.html 参数说明: Copy模块 src — 推送数据的源文件信息 dest — 推送数据的目标路径backup — 对推送传输过去的文件,进行备份content — 直接批量在被管理端文件中添加内容group — 将本地文件推送到远端,指定文件属组信息owner — 将本地文件推送到远端,指定文件属主信息mode — 将本地文件推送到远端,指定文件权限信息force — 分为force=no或yes,如果目标主机包含该文件,但内容不同,设置为yes,则强制覆盖,如果为no,则只有当目标主机的目标位置不存在该文件时,才复制。默认为yes 实践1:把/etc/hosts拷贝到/opt下,权限设置400,用户和组设置root ansible oldboy -m copy -a "src=/etc/hosts dest=/opt mode=0400 owner=root group=root backup=yes" 实践2:把/etc/passwd拷贝/tmp下改名为oldgirl,用户和组为oldboy,权限600,如果有存在同名文件覆盖 ansible oldboy -m copy -a "src=/etc/passwd dest=/tmp/oldgirl.txt owner=oldboy group=oldboy mode=0600 force=yes" 批量分发host需求,操作前备份: ansible oldboy -m copy -a "src=/etc/hosts dest=/etc/hosts mode=0644 owner=root group=root backup=yes" 分发脚本,给他执行权限 ansible oldboy -m copy -a "src=/server/scripts/bak.sh dest=/server/scripts/ mode=ugo+x" 完事去检查 12.3 script模块功能说明: 功能说明:远程节点上运行本地脚本模块 官方链接:http://docs.ansible.com/ansible/latest/script_module.html 参数说明: 本地脚本,在远端执行。 [root@m01 /server/scripts]# ansible oldboy -m script -a "/server/scripts/new.sh" 12.5 file模块功能说明: 功能说明:设置文件属性 官方链接:http://docs.ansible.com/ansible/latest/copy_module.html path — 指定远程主机目录或文件信息recurse — 递归授权state —directory — 在远端创建目录touch — 在远端创建文件link — link或hard表示创建链接文件absent — 表示删除文件或目录mode — 设置文件或目录权限owner — 设置文件或目录属主信息group — 设置文件或目录属组信息 参数实践:创建数据文件(普通文件目录软链接文件) ansible oldboy -m file -a "dest=/tmp/oldboy_dir state=directory" ansible oldboy -m command -a "mkdir -p /tmp/oldboy_dir1 warn=false" ansible oldboy -m file -a "dest=/tmp/oldboy1 state=touch" ansible oldboy -m command -a "touch /tmp/oldboy_file1.txt warn=false" ================================================================ 替代方案: ansible oldboy -m command -a "chmod 777 /etc/hosts warn=false" ansible oldboy -m command -a "chmod 644 /etc/hosts warn=false" ansible oldboy -m command -a "chown oldboy /etc/hosts warn=false" ansible oldboy -m command -a "chown root /etc/hosts warn=false" 创建目录:mkdir /tmp/oldboy_dir ansible oldboy -m file -a "dest=/tmp/oldboy_dir state=directory" 递归设置权限: ansible oldboy -m file -a "dest=/tmp/oldboy_dir state=directory mode=644 recurse=yes" 创建文件:touch /tmp/oldboy_file ansible oldboy -m file -a "dest=/tmp/oldboy_file state=touch" 删除文件:rm -f /tmp/oldboy_file ansible oldboy -m file -a "dest=/tmp/oldboy_file state=absent" 创建链接文件:ln -s /etc/hosts /tmp/link_file ansible oldboy -m file -a "src=/etc/hosts dest=/tmp/link_file state=link" ansible oldboy -m file -a "dest=/tmp/oldboy_file state=touch owner=oldboy group=oldboy mode=000" ansible oldboy -m file -a "dest=/tmp/oldboy_file state=touch owner=oldboy group=oldboy mode=ugo=rwx" 作业:批量创建5个用户oldboy01-05,然后设置123456密码,然后同时在所有客户端执行 12.6 yum模块功能说明: 功能说明:yum包管理模块 官方链接:http://docs.ansible.com/ansible/latest/yum_module.html name ---指定要安装的软件包名称 state ---指定使用yum的方法 installed,present ---安装软件包 removed,absent ---移除软件包 latest ---安装最新软件包 ansible oldboy -m command -a "yum install nginx -y" ansible oldboy -m yum -a "name=nginx state=installed" ansible oldboy -m yum -a "name=nc state=installed" [root@nfs01 oldboy_dir]# rpm -qa nginx nginx-1.10.2-1.el6.x86_64 ###不要用yum卸载,可用rpm -e卸载。 ansible系统类型模块说明 12.7 systemd模块功能说明:(service模块) 功能说明:yum包管理模块 官方链接:http://docs.ansible.com/ansible/latest/service_module.html 参数说明: service nfs restart /etc/init.d/nfs restart systemctl restart nfs State=动作要干什么 Name=名字 Enabled=no要不要开机自启no是不开启 yes是开启 实践: ansible oldboy -m systemd -a "name=crond.service enabled=no state=stopped " ansible oldboy -m command -a "systemctl status crond" ansible oldboy -m systemd -a "name=crond.service enabled=yes state=started" 百度ansible systemd https://hoxis.github.io/ansible-system-modules.html https://www.cnblogs.com/mcsiberiawolf/articles/10083626.html [root@backup ~]# service crond restart Redirecting to /bin/systemctl restart crond.service #service模块功能说明: 功能说明:启动停止服务 官方链接:http://docs.ansible.com/ansible/latest/service_module.html #相当于 #service crond stop|/etc/init.d/crond stop #chkconfig crond off ansible oldboy -m service -a "name=crond state=stop enabled=no" #相当于/etc/init.d/crond start chkconfig crond on ansible oldboy -m service -a "name=crond state=started enabled=yes" ansible oldboy -m command -a "name=crond state=started enabled=yes" 12.8 cron模块功能说明: 功能说明:管理定时任务条目信息模块 cron Manage cron.d and crontab entries 官方链接:http://docs.ansible.com/ansible/latest/cron_module.html 定时任务格式: * * * * * CMD 创建定时任务: ansible oldboy -m cron -a "name='sync time' minute=00 hour=00 job='/usr/sbin/ntpdate time.nist.gov >/dev/null 2>&1'" [root@backup ~]# crontab -l #crond-id-001:time sync by oldboy */5 * * * * /usr/sbin/ntpdate ntp3.aliyun.com >/dev/null 2>&1 #Ansible: sync time 00 00 * * * /usr/sbin/ntpdate time.nist.gov >/dev/null 2>&1 结果: #Ansible: sync time 00 00 * * * /usr/sbin/ntpdate time.nist.gov >/dev/null 2>&1 添加如下定时任务: 05 03 * * * /bin/sh /server/scripts/backup.sh >/dev/null 2>&1 命令如下: ansible oldboy -m cron -a "name='backup data' minute=05 hour=03 job='/bin/sh /server/scripts/backup.sh >/dev/null 2>&1'" 结果: #Ansible: backup data 05 03 * * * /bin/sh /server/scripts/backup.sh /server/scripts/list >/dev/null 2>&1 删除定时任务:state=absent backup=yes ansible oldboy -m cron -a "name='backup data' state=absent backup=yes" 名字不变的前提下,修改ansible参数内容,就是修改定时任务。