对于服务器集中式管理的一些理解与应用

帐号管理:ldap 集群+ssl

监控:nagios+check_mk,cacti,zibbix (模板不太好整)

操作系统初始化安装:cobbler(redhat,centos,debian都支持),通过mac地址可以指定服务器的ip地址,服务器名。puppet 可以初始化一些系统参数。当然也可以管理应用配置文件等。puppet的主要的问题在于一是大规模机器对puppet master 的压力。二是puppet 集群的。

salt:可以在master 上执行任意执行命令下发到slave 上,这点我最喜欢。其他的文件管理与软件包的管理与puppet 基本一样。

内部dns:mydns,bind。mydns 配置简单,后台支持mysql,有前端页面展示,非常的友好。mydns的集群可以通过mysql 集群去做,效果还不错,。我就是这样干的。bind要支持mysql配置稍微复杂一点。

机器名的命名规则:可以根据自己需要来,比如 地名+机房名+机柜+第几台+用途.域名 自己看起来一目了然,盘点好盘点,找故障也比较好找。

硬件故障的监控:如果是dell服务器,那么问题就简单了,nagios+check_openmanage 可以很好的实现对服务器硬件状态的监控、报警(包括邮件,短信等)。

应用故障的监控处理:监控,我比较钟情于nagios,一是在于配置简单,二是在于可以自己写插件,三是可以很随意的配置报警时间段,给谁报警(定义故障级别)。唯一不足就是抖动比较大。故障的处理方面如果是在集群里面,可以很容易的把故障点踢出去,恢复后再加进来。对于单点故障来说具体应用就得具体分析。


你可能感兴趣的:(服务器集中式管理)