jiangmingfei

zabbix监控elasticsearch集群

今天同事负责的es集群发生了脑裂，具体原因还有待查看日志。
顺便分享一套zabbix监控es集群的脚本。

生产改进与建议：

所有监控统一status值，比如0是ok的，1是警告，2是error
因为es集群会自己维护整个集群的元数据，因此数据收集不是按节点来的而是整个集群
现在的配置是从salt的pillar中获取端口（或者说集群名）然后渲染下面的脚本，然后再自动发现集群下面的节点。建议集群也使用脚本自动检查，特别是一个主机上有多个属于不同集群的es节点时。
es内部gc的平均时间没有计算出来，后期可以加
最后还是脚本中要收集的数据还是用字符串的+，也在此收集更高效的处理方法

架构方面：

初步估计es集群脑裂不外乎两个原因
- 网络原因，适当调整es集群内节点发现超时时间
- master节点和data节点混在一起，当data节点由于业务原因hang住时，可能会导致集群将此节点剔除，引起es集群重新选举。
解决：
- master节点和data节点分离，使用3个master节点，其余做data节点，master节点的jvm配置可以配置小一点。es集群的监控放在master节点上。

#!/usr/bin/env python
#coding:utf-8

from __future__ import division   #必须在第一行
import json,requests,sys,os
import pickle



#在os.popen中执行的时候\b要加一层\
#如果没有指定ip，就使用默认的，用系统命令抓取本地ip地址：
cmd = "ip addr|grep '\\binet\\b'|grep -E 'bond0|eth0'|awk '{print $2}'|awk -F'/' '{print $1}'"
local_ip = os.popen(cmd).read().strip()

#设置一个默认端口9200,这个后期使用自动发现比较好
local_port = 9200


def discovery(local_ip,local_port):
    r = {}
    r['data'] = []

    res = requests.get("http://{0}:{1}/_cat/nodes?v&h=name".format(local_ip,local_port))
    if res.status_code == 200:
        ret = res.text.splitlines()
        for i in range(1,len(ret)):
            r['data'].append({'{#NODE}':ret[i]})
    return json.dumps(r)


def send(local_ip,local_port):
    r_str = ""
    zbx_sender_cmd = "{0} -c {1} -i {2}"
    zbx_conf = "/usr/local/services/zabbix-3.0.0/etc/zabbix_agentd.conf"
    zbx_sender_file = "/tmp/.zbx_elastic_sender.txt"
    zbx_sender = "/usr/local/services/zabbix-3.0.0/bin/zabbix_sender"
    last_file = "/usr/local/services/zabbix-3.0.0/etc/.zbx_elstic_last_data.txt"

    #需要pickle保存到文件中的字典
    this_data = {}

    #导入历史数据
    if os.path.exists(last_file):
        with open(last_file,"r") as f1:
            last_data = pickle.load(f1)
    else:
        os.popen("touch /usr/local/services/zabbix-3.0.0/etc/.zbx_elstic_last_data.txt")
        last_data = {}
    #print(last_data)

    # 获取node信息的url
    url_node = "http://{0}:{1}/_nodes/stats?pretty".format(local_ip, local_port)
    res_node = requests.get(url_node)
    if res_node.status_code == 200:
        ret_node = res_node.json()
        for node,node_value in ret_node["nodes"].items():
            #print(ret_node["nodes"][node]["name"])  #打印出节点名字
            node_name = node_value["name"]
            this_data[node_name] = {}

            #需要获取docs,segments,get,search,merges,flush,warmer等信息
            #docs,segments
            r_str += "- elastic.indices.docs.count.[{0}] {1}\n".format(node_name,node_value["indices"]["docs"]["count"])
            r_str += "- elastic.indices.docs.deleted.[{0}] {1}\n".format(node_name, node_value["indices"]["docs"]["deleted"])
            r_str += "- elastic.indices.segments.count.[{0}] {1}\n".format(node_name, node_value["indices"]["segments"]["count"])
            r_str += "- elastic.indices.segments.memory.[{0}] {1}\n".format(node_name,node_value["indices"]["segments"]["memory_in_bytes"])

            #indexing,get,search
            indexing_num = node_value["indices"]["indexing"]["index_total"]
            indexing_time = node_value["indices"]["indexing"]["index_time_in_millis"]/1000
            r_str += "- elastic.indices.indexing.total.[{0}] {1}\n".format(node_name, indexing_num)
            this_data[node_name].update({"indexing_num": indexing_num})
            r_str += "- elastic.indices.indexing.time.[{0}] {1}\n".format(node_name, indexing_time)
            this_data[node_name].update({"indexing_time": indexing_time})
            if node_name not in last_data.keys() or (indexing_num - last_data[node_name]["indexing_num"]) == 0:
                r_str += "- elastic.indices.indexing.per_time.[{0}] {1}\n".format(node_name,0)
            else:
                r_str += "- elastic.indices.indexing.per_time.[{0}] {1}\n".format(node_name,
                        round((indexing_time - last_data[node_name]["indexing_time"])/(indexing_num - last_data[node_name]["indexing_num"]),3)
                                                                          )

            get_num = node_value["indices"]["get"]["total"]
            get_time = node_value["indices"]["get"]["time_in_millis"]/1000
            r_str += "- elastic.indices.get.total.[{0}] {1}\n".format(node_name, get_num)
            this_data[node_name].update({"get_num": get_num})
            r_str += "- elastic.indices.get.time.[{0}] {1}\n".format(node_name, get_time)
            this_data[node_name].update({"get_time": get_time})
            if node_name not in last_data.keys() or (get_num - last_data[node_name]["get_num"]) == 0:
                r_str += "- elastic.indices.get.per_time.[{0}] {1}\n".format(node_name,0)
            else:
                r_str += "- elastic.indices.get.per_time.[{0}] {1}\n".format(node_name,
                        round((get_time - last_data[node_name]["get_time"])/(get_num - last_data[node_name]["get_num"]),3)
                                                                     )

            query_num = node_value["indices"]["search"]["query_total"]
            query_time = node_value["indices"]["search"]["query_time_in_millis"]/1000
            r_str += "- elastic.indices.search.query_total.[{0}] {1}\n".format(node_name, query_num)
            this_data[node_name].update({"query_num": query_num})
            r_str += "- elastic.indices.search.query_time.[{0}] {1}\n".format(node_name, query_time)
            this_data[node_name].update({"query_time": query_time})
            if node_name not in last_data.keys() or (query_num - last_data[node_name]["query_num"]) == 0:
                r_str += "- elastic.indices.query.per_time.[{0}] {1}\n".format(node_name,0)
            else:
                r_str += "- elastic.indices.query.per_time.[{0}] {1}\n".format(node_name,
                        round((query_time - last_data[node_name]["query_time"])/(query_num - last_data[node_name]["query_num"]),3)
                                                                         )

            fetch_num = node_value["indices"]["search"]["fetch_total"]
            fetch_time = node_value["indices"]["search"]["fetch_time_in_millis"]/1000
            r_str += "- elastic.indices.search.fetch_total.[{0}] {1}\n".format(node_name, fetch_num)
            this_data[node_name].update({"fetch_num": fetch_num})
            r_str += "- elastic.indices.search.fetch_time.[{0}] {1}\n".format(node_name,fetch_time)
            this_data[node_name].update({"fetch_time": fetch_time})
            if node_name not in last_data.keys() or (fetch_num - last_data[node_name]["fetch_num"]) == 0:
                r_str += "- elastic.indices.fetch.per_time.[{0}] {1}\n".format(node_name,0)
            else:
                r_str += "- elastic.indices.fetch.per_time.[{0}] {1}\n".format(node_name,
                        round((fetch_time - last_data[node_name]["fetch_time"])/(fetch_num - last_data[node_name]["fetch_num"]),3)
                                                                         )

            #merges,refresh,flush,warmer
            for oper in ["merges","refresh","flush","warmer"]:
                #这里有点容易混淆
                p_data = {}
                str_num = "{0}_num".format(oper)
                str_time = "{0}_time".format(oper)
                p_data[str_num] = node_value["indices"][oper]["total"]
                p_data[str_time] = node_value["indices"][oper]["total_time_in_millis"]/1000

                r_str += "- elastic.indices.{0}.total.[{1}] {2}\n".format(oper,node_name, p_data[str_num])
                this_data[node_name].update({"{0}_num".format(oper): p_data[str_num]})
                r_str += "- elastic.indices.{0}.time.[{1}] {2}\n".format(oper,node_name, p_data[str_time])
                this_data[node_name].update({"{0}_time".format(oper): p_data[str_time]})
                if node_name not in last_data.keys() or (p_data[str_num] - last_data[node_name][str_num]) == 0:
                    r_str += "- elastic.indices.{0}.per_time.[{1}] {2}\n".format(oper,node_name, 0)
                else:
                    r_str += "- elastic.indices.{0}.per_time.[{1}] {2}\n".format(oper,node_name,
                                round((p_data[str_time] - last_data[node_name][str_time]) / (p_data[str_num] - last_data[node_name][str_num]),3)
                                                                               )

            #jvm基本
            r_str += "- elastic.jvm.heap_max_in_bytes.[{0}] {1}\n".format(node_name,node_value["jvm"]["mem"]["heap_max_in_bytes"])
            r_str += "- elastic.jvm.heap_used_in_bytes.[{0}] {1}\n".format(node_name,node_value["jvm"]["mem"]["heap_used_in_bytes"])
            r_str += "- elastic.jvm.threads.[{0}] {1}\n".format(node_name,node_value["jvm"]["threads"]["count"])
            r_str += "- elastic.jvm.buffer_pools.used_in_bytes.[{0}] {1}\n".format(node_name,node_value["jvm"]["buffer_pools"]["direct"]["used_in_bytes"])
            r_str += "- elastic.jvm.buffer_pools.total_capacity_in_bytes.[{0}] {1}\n".format(node_name,node_value["jvm"]["buffer_pools"]["direct"]["total_capacity_in_bytes"])

            #jvm垃圾回收的两个总量，要用减法。后面改进要计算出平均垃圾回收的时间
            r_str += "- elastic.jvm.gc.young.num.[{0}] {1}\n".format(node_name,node_value["jvm"]["gc"]["collectors"]["young"]["collection_count"])
            r_str += "- elastic.jvm.gc.young.time.[{0}] {1}\n".format(node_name,node_value["jvm"]["gc"]["collectors"]["young"]["collection_time_in_millis"]/1000)
            r_str += "- elastic.jvm.gc.old.num.[{0}] {1}\n".format(node_name,node_value["jvm"]["gc"]["collectors"]["old"]["collection_count"])
            r_str += "- elastic.jvm.gc.old.time.[{0}] {1}\n".format(node_name,node_value["jvm"]["gc"]["collectors"]["old"]["collection_time_in_millis"]/1000)

            for m,n in node_value["jvm"]["mem"]["pools"].items():
                r_str += "- elastic.jvm.{0}.used_in_bytes.[{1}] {2}\n".format(m,node_name,n["used_in_bytes"])
                r_str += "- elastic.jvm.{0}.max_in_bytes.[{1}] {2}\n".format(m,node_name,n["max_in_bytes"])

            #thread_pool，这个东西正常情况下没什么，有些时候还是能发现很多问题的
            for k,v in node_value["thread_pool"].items():
                r_str += "- elastic.thread_pool.{0}.threads.[{1}] {2}\n".format(k,node_name,v[u"threads"])
                r_str += "- elastic.thread_pool.{0}.threads.queue.[{1}] {2}\n".format(k,node_name,v[u"queue"])

            #http和script，其中script是总的数据，做减法
            r_str += "- elastic.http.current_open.[{0}] {1}\n".format(node_name,node_value["http"]["current_open"])
            r_str += "- elastic.script.compilations.[{0}] {1}\n".format(node_name,node_value["script"]["compilations"])

            #处理每种操作的平均时间time差值/total差值
            with open(last_file,"w") as f2:
                pickle.dump(this_data,f2)



    else:
        sys.stderr.write("Fetch node info error!")


    # 获取集群信息的url
    url_cluster = "http://{0}:{1}/_cluster/health".format(local_ip, local_port)
    res_cluster = requests.get(url_cluster)
    if res_cluster.status_code == 200:
        ret_cluster = res_cluster.json()

        #print(ret_cluster)
        #绿是0，黄是1，红是2
        if ret_cluster[u'status'] == u"green":
            status = 0
        elif ret_cluster[u'status'] == u"yellow":
            status = 1
        else:
            status = 2

        r_str +=  "- elastic.cluster.status {0}\n".format(status)
        r_str += "- elastic.cluster.non {0}\n".format(ret_cluster[u"number_of_nodes"])
        r_str += "- elastic.cluster.us {0}\n".format(ret_cluster[u"unassigned_shards"])
        r_str += "- elastic.cluster.nopt {0}\n".format(ret_cluster[u"number_of_pending_tasks"])
        r_str += "- elastic.cluster.noiff {0}\n".format(ret_cluster[u"number_of_in_flight_fetch"])
        r_str += "- elastic.cluster.aps {0}\n".format(ret_cluster[u"active_primary_shards"])
        r_str += "- elastic.cluster.tmwiqm {0}\n".format(ret_cluster[u"task_max_waiting_in_queue_millis"])
        r_str += "- elastic.cluster.rs {0}\n".format(ret_cluster[u"relocating_shards"])
        r_str += "- elastic.cluster.aspan {0}\n".format(ret_cluster[u"active_shards_percent_as_number"])
        r_str += "- elastic.cluster.as {0}\n".format(ret_cluster[u"active_shards"])
        r_str += "- elastic.cluster.is {0}\n".format(ret_cluster[u"initializing_shards"])
        r_str += "- elastic.cluster.dus {0}\n".format(ret_cluster[u"delayed_unassigned_shards"])
        r_str += "- elastic.cluster.nodn {0}\n".format(ret_cluster[u"number_of_data_nodes"])
    else:
        sys.stderr.write("Fetch node info error!")

    with open(zbx_sender_file,"w") as f:
        f.write(r_str)


    send_ret = os.popen(zbx_sender_cmd.format(zbx_sender, zbx_conf, zbx_sender_file))
    #print(zbx_sender_cmd.format(zbx_sender, zbx_conf, zbx_sender_file))
    if "failed: 0" in send_ret.read():  #这一步，用一个普通的item来触发，并返回执行结果，1是正常的，0是发送异常
        print(1)
    else:
        print(0)



if __name__ == "__main__":
    if len(sys.argv) == 2 and sys.argv[1]=="discovery":
        ret = discovery(local_ip,local_port)
        print(ret)
    elif len(sys.argv) == 1:
        send(local_ip,local_port)
    else:
        sys.stderr.write("Args is wrong!")

【漏洞分享】2018年-2024年HVV 6000+个漏洞 POC 合集分享漏洞文库-Web安全漏洞复现 web安全 python 安全测试工具网络安全
此份poc集成了Zabbix、用友、通达、Wordpress、Thinkcmf、Weblogic、Tomcat等下载链接:链接:https://pan.quark.cn/s/1cd7d8607b8a
【漏洞利用】2018年-2024年HVV 6000+个漏洞 POC 合集分享 baiolkdnhjaio 漏洞复现网络安全 web安全安全
此份poc集成了Zabbix、用友、通达、Wordpress、Thinkcmf、Weblogic、Tomcat等下载链接:链接:https://pan.quark.cn/s/1cd7d8607b8a
利用zabbix监控ogg进程(Windows平台) Linux运维老纪万象人生-坚守Zabbix企业级监控岗位运维开发服务器云计算 zabbix linux
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:Linux运维老纪的首页,持续学习,不断总结,共同进步,活到老学到老导航剑指大厂系列:全面总结运维核心技术:系统基础、数据库、网路技术、系统安全、自动化运维、容器技术、监控工具、脚本编程、云服务等。常用运维工具系列:常用的运维开发工具,zab
RPM安装的程序在哪里？年薪丰厚 linux 服务器 centos rpm
假如我要安装zabbix的客户端zabbix-agent2，刚好我在网上下载到了他的安装包zabbix-agent2-5.0.42-1.el7.x86_64.rpm。这个安装包zabbix-agent2-5.0.42-1.el7.x86_64.rpm就是rpm文件。如果我用rpm方式去安装这个rpm文件，机器首先会检查当下这个环境里面有没有zabbix-agent2所需要的依赖。举个例子，yumi
zabbix的组件 BK_小小关各种服务运维 linux centos zabbix
组件说明1)zabbixserver:负责接收agent发送的报告信息的核心组件，所有配置、统计数据及操作数据都由它组织进行;2)databasestorage:专用于存储所有配置信息，以及由zabbix.收集的数据;e3）webinterface:zabbix的GUI接口;e4)proxy:可选组件，常用于监控节点很多的分布式环境中，代理server收集部分数据转发到server，可以减轻ser
zabbix4.0安装+grafana数据展示——cent7.3 运维实战课程 grafana zabbix linux 运维
zabbix4.0安装+grafana数据展示——cent7.3如果对运维课程感兴趣，可以在b站上搜索我的账号：运维实战课程，可以关注我，学习更多免费的运维实战技术视频Zabbix_server:192.168.43.166被监控端：192.168.43.xxlnmp工作过程：用户请求nginx，当请求静态页面，nginx直接返回给用户，当请求动态页面,如php程序文件，nginx会调用php-f
zabbix通过snmp监控物理服务器硬件信息蜜蜜不吃糖服务器 zabbix 运维
背景：公司的华三服务器周末的时候市电跳闸，监控没有设置告警，幸好有UPS供电，工作日发现问题后市电恢复。方法：1、登陆物理服务器带外，开放snmp并设置团体名2、找一台安装了nmap的机器，查看服务器IP对应的161端口是否放通[root@zabbix~]#nmap-p161-sU10.10.99.70StartingNmap6.40(http://nmap.org)at2024-08-2115:
zabbix 介绍 crazy_zhangcong linux
zabbix介绍1、Zabbix描述Zabbix是一个企业级的高度集成开源监控软件，提供分布式监控解决方案，可以用来监控设备、服务等的可用性和性能，其产品不分企业版和社区版，是一个真正的源代码开放产品，用户可以自由下载并使用该软件。官方网站信息：Zabbix官网http://www.zabbix.com官方论坛http://www.zabbix.com/forum/代码托管地址http://sou
Zabbix的简介蜡笔晓心 zabbix zabbix
Zabbix简介一、Zabbix介绍Zabbix是一个企业级的、开源的、分布式的监控套件Zabbix可以监控网络和服务的监控状况.Zabbix利用灵活的告警机制，允许用户对事件发送基于Email的告警.这样可以保证快速的对问题作出响应.Zabbix可以利用存储数据提供杰出的报告及图形化方式.这一特性将帮助用户完成容量规划.Zabbix支持polling和trapping两种方式.所有的Zabbix
IT技术学习之开发(六) opcc
上次好像说到了反映zabbix数据，我又打算回到web形式，一劳永逸，比word形式的更好，但web形式的开发又涉及到了很多其他技术，比如前端、中间件，以及如何用它们调用后端数据。之前突击了一阵技术文章，之后就沉寂了几个月，最近又开始搞，稍微学了点皮毛，拿来晒晒。Python有现成的web应用框架，可以快速的搭建网站，我用的是Django框架，介绍性的内容大家可以上网查查，资料很多，都比我说的好，
zabbix安装 Y-小姐 zabbix
a.安装Zabbix仓库#rpm-Uvhhttps://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm#yumcleanallb.安装Zabbixserver、前端、agent#yuminstallzabbix-server-mysqlzabbix-agentc.安装Zabbix前端启用红帽软
如何在linux上部署zabbix监控工具专业白嫖怪常用业务组件 zabbix linux 服务器
搭建服务机1）首先我们先执行sed-i's/SELINUX=enforcing/SELINUX=disabled/'/etc/selinux/config#然后我们再把防火墙开机自启关掉马上生效systemctldisable--nowfirewalld2）我们获得rpm包rpm-Uvhhttps://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86
zabbix和prometheus介绍；云原生张小胡 zabbix prometheus
监控Prometheus和Zabbix作为两种流行的监控系统，它们在多个方面存在显著的差异。以下是对两者区别的详细分析：一、数据模型与采集方式Prometheus：数据模型：基于度量指标的模型，支持多维度数据模型，每个时间序列数据都包含多个标签（label），用于描述数据的不同属性。这种模型使得用户可以灵活地对数据进行筛选、聚合和组合。采集方式：采用Pull模式，通过HTTP协议从被监控端主动拉取
zabbix对接飞书机器人告警萌新包大人 linux zabbix 脚本 zabbix 飞书机器人
zabbix对接飞书机器人告警一、zabbix后台配置1.创建报警媒介类型{ALERT.MESSAGE}{ALERT.SENDTO}{ALERT.SUBJECT}2.导入脚本目录在/usr/lib/zabbix/alertscripts/feishu.py#!/usr/bin/python3#-*-coding:utf-8-*-importrequestsimportjsonimportsys
get value from agent failed: cannot connect to [[127.0.0.1]:10050]: [111] Connection refused LBL1220 监控 linux zabbix
部署zabbix服务端时，查看主机配置。zabbix服务端主机虽然显示已启用，但ZBX字体是红色的。且报错如下：zabbix-Getvaluefromagentfailed:cannotconnectto[[127.0.0.1]:10050]:[111]Connectionrefused意思是agent连接失败1）查看防火墙[root@m01~]#getenforceDisabled[root@m
zabbix添加端口监控一只刚刚开始吃猫粮的运维狗
日常运维中不仅仅有URL监控，服务监控，往往在服务的运行还伴随有端口的监控，下面就来介绍zabbix如何添加端口监控在相应主机中选择监控项，并添加监控项图片.png1.添加一个名称2.健值选择添加选择net.tcp.listen[port]图片.png3.将[port]里面的端口改成你要监控的端口即可4.一般添加完端口的监控项没有什么意义，能实现监控还需要添加一个触发器，这样在端口或服务出现问题的
Redhat8 搭建Zabbix6-03之前端优化及常用测试工具知名“矿工” 系统集成 #安装部署 zabbix
取消URL后缀默认URL为:http://serverip/zabbix修改URL为:http://serverip##修改路径nano/etc/httpd/conf/httpd.conf#DocumentRoot"/var/www/html"DocumentRoot"/usr/share/zabbix"##重启web与zabbixserver服务systemctlrestarthttpdsyst
Zabbix跨版本升级指南，4.2-6.0 Zabbix_China 数据库 php mysql zabbix
【作者】武玉森，就职于国内某城商行，从事运维框架及智能监控等方面工作，对操作系统、开源监控等方面具有丰富的实践经验。Zabbix6.0LTS已经发布了一段时间了，面对那么香的新鲜功能，回头看看自己Zabbix4.2版本，难道只能看着眼馋嘛？！可是如何完成跨版本升级，分析官方文档给出了以下建议：Zabbix4.2→Zabbix5.x→Zabbix6.0然而面对7*24小时的无中断业务要求，如果按部就
Zabbix架构概述 weixin_34414196 运维数据库
Zabbix概述zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix能监视各种网络参数，保证服务器系统的安全运营；并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。zabbix由2部分构成，zabbixserver与可选组件zabbixagent。zabbixserver可以通过SNMP，zabbixagent，ping，端口监视等
大数据开源框架技术汇总浪尖聊大数据-浪尖数据仓库 hive flume 分布式 scipy makefile crm lighttpd
主要基于对现阶段一些常用的大数据开源框架技术的整理，只是一些简单的介绍，并不是详细技术梳理。可能会有疏漏，发现再整理。参考的太多，就不一一列出来了。这只是作为一个梳理，对以后选型或者扩展的做个参考。目录系统平台（Hadoop、CDH、HDP）监控管理（CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle）文件系统（HDFS、GPFS、Ceph、Gluster
Zabbix創建圖形 Maliao
單個監控項的圖形都是獨立的，若要同時比較多主機、多監控項，就需要創建自定圖形。監控項創建圖形之前必須建立好監控項。image1.創建圖形先選擇主機在創建圖形。image2.設置圖形加入監控項將希望同時比較的監控項都加入到圖形中。image調整顯示功能功能選擇所有，這樣查看圖形時除了最新之外的"最小"、"平均"、"最大"都會顯示。image3.設置完成查看圖形image
Zabbix HA高可用集群搭建 KK小草莓 zabbix
ZabbixHA高可用集群搭建ZabbixHA高可用集群搭建一、Zabbix高可用集群（ZabbixHA）二、部署Zabbix高可用集群1、两个服务端配置1.1主节点ZabbixServer配置1.2备节点ZabbixServer配置1.3主备节点添加监控主机1.4查看高可用集群状态2、两个客户端配置2.1修改agent01和agent02的配置文件2.2查看web页面3、故障模拟和效果测试3.1
zabbixApi4j-Graph item 差不多先生_tl
Graphitemgraphitem.get:检索图项目image.pngGraphItemGetTestpackagecn.com.yeexun.testzabbix.zabbix4j.example.graphitem;importstaticorg.junit.Assert.assertNotNull;importorg.junit.Test;importcn.com.yeexun.test
linux系统Grafana关联zabbix显示丨析木丨 linux linux grafana zabbix
Grafana关联zabbix服务器下载浏览器配置开启zabbix插件配置zabbix数据源可视化Zabbix数据服务器下载grafana-clipluginslist-remotegrafana-clipluginslist-remote|grep-izabbixgrafana-clipluginsinstallalexanderzobnin-zabbix-appsystemctlrestart
每日一个shell脚本之一键部署Zabbix M乔木 Shell zabbix 学习方法开发语言安全 bash
每日一个shell脚本之一键部署Zabbix上一期我们展示了一键部署Agent端zabbix提升业务效率，本期带来一键部署zabbix的server端的服务脚本！源码参上#!/usr/bin/bash#**************************************#CSDN:M乔木#qq邮箱:[email protected]#解释器:这是一个shell脚本#************
docker （七）-部署容器小关暗器 docker 容器运维
实战开始：1docker部署kafka集群，并验证参考Docker搭建Kafka集群优秀文档2docker部署mysql参考上一篇docker(六)3.docker部署zabbix参考docker部署zabbix优秀文档BUG：根据这篇文章部署后，发现zabbix-server图形时间与本地时间相差五个小时参考优秀文档思路修改dockerexec-itzabbix-web-nginx-mysql/
Zabbix創建觸發器 Maliao
觸發器可針對監控項設置警報等級及發報時機。監控項創建觸發器之前必須建立好監控項。image1.創建觸發器先選擇主機在創建觸發器。image進入觸發器頁面image2.如何設置觸發器創建需求先列出創建需求，舉例：目前我希望根據監測Nginx1的實時情況，若timeout或超時200毫秒就發報。如何填寫表達式初次使用可以點擊表達式空白輸入匡下方的"表達式構造器"，幫助構造。image表達式之一time
（四十）大数据实战——Zabbix监控平台的部署搭建厉害哥哥吖大数据大数据
前言Zabbix是一款能够监控各种网络参数以及服务器健康性和完整性的软件。Zabbix使用灵活的通知机制，允许用户为几乎任何事件配置基于邮件的告警，这样可以快速反馈服务器的问题。基于已存储的数据，Zabbix提供了出色的报告和数据可视化功能。Zabbix支持轮询和被动捕获。基于Web的前端页面确保您的网络状态和服务器健康状况可以从任何地方进行评估。在经过适当的配置后，Zabbix可以在监控IT基础
windows下安装zabbix agent 皮蛋儿皮蛋 zabbix agent windows
选择zabbix官网上已经编译好的agent包下载zabbixagent安装包Windows版本，我用的是zabbix_agents_3.4.6.win里面同时具备了32位和64位。4.0版本的agent是32位和64位分开下载的。Windows关闭防火墙：控制面板-->系统和安全-->Windowsdefender防火墙-->启用或关闭防火墙在C盘创建zabbix目录，解压zabbix_agen
Zabbix图形中文乱码问题（显示口口）解决办法小关暗器 zabbix
一切换到zabbix安装目录assets/fonts下，下载字体这里使用是nginx+php作为zabbix-web展示，使用find命令查找进入目录下，将原有字体备份，下载msyh字体wgethttps://www.xxshell.com/download/sh/zabbix/ttf/msyh.ttf二修改配置文件，替换字体，使用find命令查找配置文件路径vim/usr/share/nginx
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

zabbix监控elasticsearch集群

生产改进与建议：

架构方面：

你可能感兴趣的:(zabbix)