monitorServer nagios / cacti / tivoli / zabbix / SaltStack

 

SaltStack 自动化配置管理工具

Zabbix 与自动化配置管理工具SaltStack

http://book.51cto.com/art/201408/449519.htm

《Zabbix企业级分布式监控系统》第9章Zabbix 与自动化运维,本章重点介绍这部分内容。同时,考虑到配置文件的管理,本章对SaltStack 自动化配置工具也进行了讲解,从工具层面展示了自动化运维底层的配置管理。本节为大家介绍Zabbix 与自动化配置管理工具SaltStack。

四大配置管理工具测评手记

http://www.ccw.com.cn/article/view/57348

Puppet企业版、 企业版Chef、AnsibleWorks Ansible、SaltStack企业版

SaltStack

http://runpanda.iteye.com/blog/2159841

【基本介绍】 
这里介绍saltstack的作用与定位。 

【简单介绍】 
saltstack是什么? 
它是用python写的,对设备轻量级,通讯层使用0MQ(http://www.zeromq.org ),并且是开源的,遵守Apache2(http://www.apache.org/licenses/LICENSE-2.0 )开源协议,拥有开源社区。 

saltstack能用来做什么? 
1.远程执行 2.指令配置存储 
当你有数十台,甚至上百台服务器的时候,需要对每一台服务器修改同一个配置文件的时候,我们该如何抉择呢,一台一台登入修改,还是一下针对所有做修改。效率明显不同。salt远程执行就可以实现对服务器集群的同步操作。 
相同的操作可以以配置文件的形式保存下来,这样以后对其他服务器就可以执行相同的指令。 

 

自动化运维工具SaltStack详细部署

http://sofar.blog.51cto.com/353572/1596960/

==========================================================================================
一、基础介绍
==========================================================================================
1、简介
SaltStack是一个服务器基础架构集中化管理平台,具备配置管理、远程执行、监控等功能,一般可以理解为简化版的puppet和加强版的func。SaltStack基于Python语言实现,结合轻量级消息队列(ZeroMQ)与Python第三方模块(Pyzmq、PyCrypto、Pyjinjia2、python-msgpack和PyYAML等)构建。

 

通过部署SaltStack环境,我们可以在成千上万台服务器上做到批量执行命令,根据不同业务特性进行配置集中化管理、分发文件、采集服务器数据、操作系统基础及软件包管理等,SaltStack是运维人员提高工作效率、规范业务配置与操作的利器。

 

2、特性
(1)、部署简单、方便;
(2)、支持大部分UNIX/Linux及Windows环境;
(3)、主从集中化管理;
(4)、配置简单、功能强大、扩展性强;
(5)、主控端(master)和被控端(minion)基于证书认证,安全可靠;

(6)、支持API及自定义模块,可通过Python轻松扩展。

monitorServer nagios / cacti / tivoli / zabbix / SaltStack_第1张图片

 

3、Master与Minion认证
(1)、minion在第一次启动时,会在/etc/salt/pki/minion/(该路径在/etc/salt/minion里面设置)下自动生成minion.pem(private key)和 minion.pub(public key),然后将 minion.pub发送给master。

(2)、master在接收到minion的public key后,通过salt-key命令accept minion public key,这样在master的/etc/salt/pki/master/minions下的将会存放以minion id命名的 public key,然后master就能对minion发送指令了。

 

4、Master与Minion的连接
(1)、SaltStack master启动后默认监听4505和4506两个端口。4505(publish_port)为saltstack的消息发布系统,4506(ret_port)为saltstack客户端与服务端通信的端口。如果使用lsof 查看4505端口,会发现所有的minion在4505端口持续保持在ESTABLISHED状态。

wKioL1Sf0JHwhBhaAAEsYS9e6HE690.jpg

 

(2)、minion与master之间的通信模式如下:

monitorServer nagios / cacti / tivoli / zabbix / SaltStack_第2张图片

 

5、本次测试环境

IP地址

角色

系统环境

10.133.33.85

master

CentOS 6.3

10.130.87.151

minion

CentOS 6.3

 

==========================================================================================
二、SaltStack基础安装与配置
==========================================================================================
1、依赖组件说明
http://docs.saltstack.com/en/latest/topics/installation/index.html

wKioL1Sfz__ws2EVAANpFr96RiE332.jpg

SaltStack的通信模式总共分为2种模式:ZeroMQ、REAT,鉴于REAT目前还不是太稳定,我们选择ZeroMQ模式,本次安装采用源码安装的方式。

 

 

 

end

 

 

nagios / cacti

 

nagios完整配置文档_第一版_守住每一天.pdf.zip

http://docs.linuxtone.org/ebooks/Monitoring/nagios/nagios%e5%ae%8c%e6%95%b4%e9%85%8d%e7%bd%ae%e6%96%87%e6%a1%a3(%e7%ac%ac%e4%b8%80%e7%89%88)%e5%ae%88%e4%bd%8f%e6%af%8f%e4%b8%80%e5%a4%a9.pdf

 

linux下审计的部署,要求对用户的所有命令、登录事件等记

http://bbs.linuxtone.org/thread-16116-1-1.html

psacct_工具.pdf.zip

http://dl.iteye.com/topics/download/d93e73bd-fdbb-31c9-9471-bdd997831af9

 

Linux 每日小技巧

http://bbs.linuxtone.org/thread-1775-1-1.html
1.按内存从大到小排列进程:  
[root@b2cbbs ~]# ps -eo "%C : %p : %z : %a"|sort -k5 -nr
2. 查看当前有哪些进程;查看进程打开的文件: 
[root@b2cbbs ~]# ps -A 或 lsof -p PID


3.获取当前IP地址(从中学习grep,awk,cut的作用) 
ifconfig eth0 |grep "inet addr:" |awk '{print $2}'|cut -c 6-

4.统计每个单词出现的频率,并排序 
awk '{arr[$1]+=1 }END{for(i in arr){print arr"\t"i}}' 文件名 | sort -rn


8.清空linux buffer cache
sync && echo 3 > /proc/sys/vm/drop_caches

9.将当前目录文件名全部转换成小写
for i in *; do mv "$i" "$(echo $i|tr A-Z a-z)"; done

10.消除vim中的^M的几种方法
1)dos2uninx filename 
2)sed -e 's/^M//' filename 
3)vim中 :s/^M//gc 
4)col -bx < dosfile > newfile 
5)tr -s "\r\n" "\n" < file > newfile

 

Linux每进程线程数问题处理

http://blog.csdn.net/kelly859/article/details/5819735

 

公司的一台服务器升级,原先运行正常的一个服务经常会跳出,于是予以分析解决。 该服务是一个tcp的服务端程序,被动接收客户端连接处理数据,升级后当客户端连接到一定量后程序会自动跳出。 使用netstat查看各个状态的数量 netstat -na |awk ‘{print $6}’|sort |uniq -c |sort -nr 发现很多的CLOSE_WAIT,并且还在不断增加中。 觉得可能是CLOSE_WAIT得不到释放,占用很多资源, 于是修改sysctl.conf中关于tcp连接的连接时间等设置,结果问题依旧。 怀疑收到攻击,使用 netstat -na |grep CLOSE_WAIT|awk ‘{print $5}’|awk -F”:” ‘{print $1}’|sort |uniq -c |sort -nr |wc -l 查看连接过来的地址,发现都是地址来源都是正常的 首先检查 使用 ps -fe |grep programname 查看获得进程的pid 再使用 ps -Lf pid 查看对应进程下的线程数,发现数值为303,远小于实际应该的数量。于是初步判断是由于线程数不够造成的原因。查找资料发现可以通过设置 ulimit -s 来增加每进程线程数。 每进程可用线程数 = VIRT上限/stack size 其中 VIRT 上限: 32位x86 = 3G 64位x64=64G statck size 默认是 10240 因此在默认情况下 32位系统上单进程最多可以创建300个线程, 64系统在内存充足的情况下最多可以创建 6400 个线程。 在机器硬件固定的情况下,可以通过 ulimit -s 降低stack size 的设置值来获得更多的每进程线程数。
 
linux 下端口close_wait 过多
http://blog.163.com/helj_2001/blog/static/346345682009728111725235/
 
http://liuzhster.iteye.com/blog/948692

netstat -n|awk '/^tcp/{++S[$NF]} END {for(a in S) print a,S[a]}'

相关文章

http://ahuaxuan.iteye.com/blog/657511

http://blog.163.com/helj_2001/blog/static/346345682009728111725235/

http://blog.csdn.net/kelly859/archive/2010/08/18/5819735.aspx

 

解决修改linux服务器中open_files参数后仍出现too many open files的问题

 

ulimit值(Linux文件句柄数量)在Centos5(RHEL5)中的调整

http://loamy.iteye.com/blog/380150

 

/proc/sys/fs/file-nr,可以看到整个系统目前使用的文件句柄数量

系统总限制是在这里,/proc/sys/fs/file-max.可以通过cat查看目前的值,修改/etc/sysctl.conf 中也可以控制.

 

zabbix

http://www.oschina.net/search?scope=project&q=zabbix

http://m.taoke.com/tools/pxb/signup/9221

主题:分布式监控系统Zabbix介绍

开始:2014-08-14 19:00 (周四)

结束:2014-08-14 21:00 (周四)

讲师:陈伟18115183344 / 帝联、腾讯、途牛运维

地址:主塔楼310会议室

 

 

 

taokui / 153-80576520 、137-70779679

gaorong / 177-05196258 / 138-51682526

xuwei / 158-50582074

wangdan / 139-67142900

 

zabbix_agents_2.2.1.win.zip 

zabbix-linux-agent安装.zip 

 

end

你可能感兴趣的:(Web,Server)