E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
监控报警
百万级报警平台的架构设计与实现
本次分享主要以去哪儿网百万级
监控报警
设计与实现为核心
cop66589
·
2018-11-16 10:38
Prometheus的服务发现之Consul介绍篇一
一、引言Prometheus是一套开源的系统
监控报警
框架,此前对Prometheus有过介绍Prometheus的介绍与实践,Prometheus会去各个监控节点Pull数据。
polo2044
·
2018-11-13 16:33
Java后端知识
MySQL日志故障的处理和分析
问题的起因就是收到同事提醒,根据
监控报警
提示,磁盘空间满了。上面有一个MySQL服务,现在已经写入不了数据了。
沙漏半杯
·
2018-11-08 22:24
MySQL
处理
分析
运维的独孤九剑
第一式、
监控报警
报表没有监控就是不知己,不知己每战必殆。没有报警就是不能兼听,不兼听就不明。没有报表,反正Leader不高兴,其他的也没啥吧,毕竟像杰夫·贝佐斯与张小龙这样的Leader少吧!
三杯水
·
2018-10-26 11:13
监控
架构规划
故障处理
运维心得
Prometheus的介绍与实践
一、Prometheus简介Prometheus是一套开源的系统
监控报警
框架。Prometheus作为新一代的云原生监控系统,相比传统监控监控系统(Nagios或者Zabbix)拥有如下优点。
polo2044
·
2018-10-15 11:03
Java后端知识
Zabbix篇五:配置参数优化
配置篇:Zabbix配置篇一:钉钉机器人
监控报警
Zabbix配置篇二:优化服务器Zabbix概述:使用zabbix监控服务器已有一段时间,监控的服务器不到100台,发现刷新zabbix页面有卡顿的现象。
allmrys
·
2018-09-26 18:14
zabbix
服务器
优化
Zabbix
服务器被挖矿解决办法
公司用的阿里云的机器,有一天要下班了,公司的云
监控报警
说服务器100%,我就top了一下,发现/tmp/ddgs.3013和/tmp/qW3xT.2两个文件把CPU跑满了,接着百度了一下,发现是挖矿病毒
xingchao1021
·
2018-09-19 15:06
java
挖矿
ddgs.3013
k8s node alertmanager
监控报警
配置方法
概述节点本身的监控主要监控CPU、内存、磁盘IO、文件系统可用空间即可。比如,对于使用来prometheus的alertmanager来做node报警,rules配置可以参考如下点进行配置即可。说明不同的node-exporter版本,对应的metrics也不一样,需要自己对照更改一下。CPU监控(1-avg(irate(node_cpu{mode="idle"}[10m]))by(instanc
党志强
·
2018-09-18 20:20
alertmanager
prometheus
kubernetes
kubernetes
Python中 Wxpy模块以及其监控
博主在最近有一个
监控报警
的需求需要完成,然后刚好在学习wxpy这个东西,因此很巧妙的将工作和学习联系在一起。博文中主要使用到的技术设计到Python,Redis,以及Java。
myword1314
·
2018-09-16 13:52
python
基于 ELK 与 ElaticAlert 搭建系统
监控报警
之前学习了通过ELK进行Nginx的日志收集与分析,有了日志之后我们就可以通过解析日志近实时的监控服务器的访问状态了。通常Nginx都是作为代理服务器进行使用的,当我们的应用服务因为某些原因挂掉时,Nginx访问就会出现频繁502的情况,基于这一场景我们可以进行报警来及时提醒我们去解决问题。本篇文章主要简单介绍下基于ELK实现监控的过程。一.ELK的安装首先是ELK的搭建,这里不再赘述,可以参考写
艾希射日
·
2018-08-29 08:52
ELK
Zabbix 分布式监控系统及
监控报警
系统
Zabbix分布式监控平台[root@server2~]#rpm-ivhnginx-1.8.0-1.el6.ngx.x86_64.rpm[root@server2~]#cd/etc/nginx/[root@server2nginx]#cdconf.d/[
[email protected]
]#vimdefault.conf13location/status{14stub_statuson;15ac
Argued_D
·
2018-08-16 09:53
Nginx+Keepalived实现Nginx高可用
主要考虑以下几点:1、Nginx服务因为意外现象挂掉2、服务器宕机导致NGINX不可用目前主流的解决方案就是keepalived+nginx实现nginx的故障转移,同时做好
监控报警
。
GoDevops
·
2018-08-05 00:50
keepalived
nginx
nginx主备高可用
应用集群高可用
ELK日志监控平台告警升级(邮件+钉钉)
快周末了,重新调整了一下告警通知,顺便加入钉钉机器人
监控报警
。
沐宇熙
·
2018-07-10 09:55
运维
基于Kibana的可视化
监控报警
插件sentinl的配置
前言sentinl插件可以实现按某种规则查询数据,当数据达到一定的阈值,可以实现邮件告警GitHub:https://github.com/sirensolutions/sentinldownload:https://github.com/sirensolutions/sentinl/releases安装注意:sentinl.zip的版本和Kibana的版本需要相互对应方式1:kibana-plu
会说话的鱼
·
2018-07-04 12:36
ja
Kibana
ELK
高并发与高可用实战之基础知识大型网站架构特征(一)
同时还应考虑系统容量规划(流量、容量等)、SLA指定(吞吐量、响应时间、可用性、降级方案等)、
监控报警
(机器负载、响应时间、可用率等)、应急预案(容灾、降级、限流、隔离、切流量、可回滚等)。
一抹微笑~
·
2018-06-13 00:00
ELK + Sentinl 日志实时
监控报警
钉钉、邮件
1、docker安装elk镜像:sebp/elk挂出的端口:5044,5601,9200,93002、进入容器,安装sentinl插件进入kibana安装目录:/etc/kibana/bin,执行:./kibana-plugininstallhttps://github.com/sirensolutions/sentinl/releases/download/tag-6.2.3-3/sentinl
挑葱夫
·
2018-06-08 17:19
一些神奇的工具
ELK + Sentinl 日志实时
监控报警
钉钉、邮件
1、docker安装elk镜像:sebp/elk挂出的端口:5044,5601,9200,93002、进入容器,安装sentinl插件进入kibana安装目录:/etc/kibana/bin,执行:./kibana-plugininstallhttps://github.com/sirensolutions/sentinl/releases/download/tag-6.2.3-3/sentinl
挑葱夫
·
2018-06-08 17:19
一些神奇的工具
复习整理-MQ
具有消息查询,消息回溯(不是消息撤回,也不支持消息撤回),消息轨迹查询,堆积
监控报警
功能。MQ协议支持接入方式:TCP、HTTP(RESTful风格)、MQTT。MQ支持
JR_Way
·
2018-05-22 16:13
云服务
Docker与Kubernetes在WayBlazer的实践案例
本文为Kubernetes监控系列的第四篇文章,前三篇目录如下:Kubernetes监控开源工具基本介绍以及如何使用Sysdig进行监控Kubernetes集群的
监控报警
策略最佳实践Kubernetes
Docker_
·
2018-05-17 07:49
Kubernetes服务发现与故障排除
本文为Kubernetes监控系列的第二篇文章,系列目录如下:Kubernetes监控开源工具基本介绍以及如何使用Sysdig进行监控Kubernetes集群的
监控报警
策略最佳实践Kubernetes中的服务发现与故障排除
Docker_
·
2018-05-16 00:00
Spring Boot--整合阿里云消息队列MQ
产品基于高可用分布式集群技术,提供消息发布订阅、消息轨迹查询、定时(延时)消息、资源统计、
监控报警
等一系列消息云服务,是企业级互联网架构的核心产品。
Leq
·
2018-05-10 11:10
java
SpringBoot
MQ
Prometheus+Grafana监控平台搭建
Prometheus是由SoundCloud开发的开源
监控报警
系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是GoogleBorgMon监控系统的开源版本。
JoeyDTChen
·
2018-04-26 12:42
prometheus+grafana监控K8s 搭建初探
Prometheus是由SoundCloud开发的开源
监控报警
系统和时序列数据库(TSDB).自2012年起,许多公司及组织已经采用Prometheus,并且该项目有着非常活跃的开发者和用户社区.现在已经成为一个独立的开源项目核
林刀的刀刀只会叨叨
·
2018-04-17 17:12
elk日志大盘显示和日志
监控报警
配置实践
1.Logstash1.1具体内容详解具体讲解大家可以看文档:https://www.elastic.co/guide/en/logstash/current/index.html1.2使用整体配置1.2.1项目工程中的配置在logback对应的配置文件logback-spring.xml中配置如下内容:注意encoder标签中对应的三个字段:requestUrl,traceId和clientIp
lwjaiyjk3
·
2018-04-11 15:03
日志监控报警
一个菜鸟的prometheus学习日志(一)
入门介绍:首先,Promethues是一款开源的基于时间序列数据库的
监控报警
系统。似乎是还比较容易理解的一句话,可以根据公司的需求对当前网络负载等的目标时间序列数据进行监控,然后超过某个特定的阈
Ragnarok_211
·
2018-04-09 22:42
Prometheus
运维监控篇Zabbix简单的性能调优
原文链接:http://www.cnblogs.com/Su-per-man/p/8710031.htmlZabbix是一款高性能的分布式
监控报警
系统。
alii79643
·
2018-04-03 17:00
Kubernetes集群的
监控报警
策略最佳实践
本文为Kubernetes监控系列的第二篇文章,系列目录如下:Kubernetes监控开源工具基本介绍以及如何使用Sysdig进行监控Kubernetes集群的
监控报警
策略最佳实践(本篇)Kubernetes
Docker_
·
2018-03-22 00:00
WebSocket实时消息推送
一、消息推送的实现原理与方式1.1实时性较强的场景在线聊天
监控报警
视频弹幕1.2基于HTTP的实时消息方案AJAX轮询(polling)//客户端不断发送请求到服务器长轮询(longplling)//一般
唐成勇
·
2018-02-26 00:00
nginx
websocket
程序员不可不知的Linux性能工具
前言在实际开发中,有时候会收到一些服务的
监控报警
,比如CPU飙高,内存飙高等,这个时候,我们会登录到服务器上进行排查。本篇博客将涵盖这方面的知识:Linux性能工具。
wjlovezzd
·
2018-02-08 14:14
Linux性能工具
Linux认证
linux下为什么删除了文件空间却不释放?
我们的一台应用服务器,操作系统是RedHatLinux,
监控报警
,/opt/applog文件系统使用率超阈值,整体容量为50G,但发现实际文件容量20G,剩下的30G空间是什么?
wjlovezzd
·
2018-02-06 10:12
空间
不释放
开源大数据周刊-第14期
的优化;阿里云E-Mapreduce动态E-Mapreduce团队1.4版本(正在发布):作业运行失败报警作业并行提交添加sqoop、shell类型的作业1.4.1版本集群整体运行情况的仪表盘集群状态
监控报警
资讯创业公司如何构建数据指标体系
aliyun32183
·
2018-02-05 10:41
云栖社区开源大数据周刊
开源大数据周刊-第16期
已经发布)作业运行失败报警作业并行提交添加sqoop、shell类型的作业1.4.1版本(正在研发)完善失败报警完善定时任务,增加小时、分钟定时任务1.5.0版本(正在研发)集群整体运行情况的仪表盘集群状态
监控报警
aliyun32183
·
2018-02-05 10:24
云栖社区开源大数据周刊
开源大数据周刊-第17期
已经发布)作业运行失败报警作业并行提交添加sqoop、shell类型的作业1.4.1版本(已经发布)完善失败报警完善定时任务,增加小时、分钟定时任务1.5.0版本(正在研发)集群整体运行情况的仪表盘集群状态
监控报警
aliyun32183
·
2018-02-05 10:06
云栖社区开源大数据周刊
开源大数据周刊-第18期
阿里云E-Mapreduce动态E-Mapreduce团队1.4.1版本(已经发布)完善失败报警完善定时任务,增加小时、分钟定时任务1.5.0版本(正在研发)集群整体运行情况的仪表盘集群状态
监控报警
1.6.0
aliyun32183
·
2018-02-05 10:25
云栖社区开源大数据周刊
程序员不可不知的Linux性能工具
前言在实际开发中,有时候会收到一些服务的
监控报警
,比如CPU飙高,内存飙高等,这个时候,我们会登录到服务器上进行排查。本篇博客将涵盖这方面的知识:Linux性能工具。
zfz_linux_boy
·
2018-01-25 10:14
程序员
性能工具
Java
SCOM 2016监控IIS 网页服务
之前讲到了SCOM2016对于通过分发在客户端的Agent来进行的
监控报警
。今天准备和大家一起学习一下SCOM2016对于IIS网页服务的监控和配置。
horse87
·
2018-01-08 17:06
scom
2016
web
System
Center
SCOM 2016 配置报警邮件 (上)
各位好,上几篇文章我们已经共同探讨了SystemCenter2016-OperationsManager的部署安装和管理模板部署,今天我们就来讲一讲SCOM2016的核心功能,服务器
监控报警
功能。
horse87
·
2018-01-08 09:09
SCOM2016
邮件通知
邮件报警
System
Center
15 分钟无门槛构建服务器性能监控系统
为了解决企业的此类烦恼,七牛云推出了快速构建服务器性能
监控报警
的解决方案。七牛云开源的日志/信息采集工具l
七仙女很忙
·
2018-01-02 14:05
性能监控
15 分钟无门槛构建服务器性能监控系统
为了解决企业的此类烦恼,七牛云推出了快速构建服务器性能
监控报警
的解决方案。七牛云开源的日志/信息采集工具l
csdn研发技术
·
2018-01-02 14:35
技术文章
zabbix结合微信实现
监控报警
原文地址:https://www.abcdocker.com/abcdocker/2472Zabbix可以通过多种方式把告警信息发送到指定人,常用的有邮件,短信报警方式,但是越来越多的企业开始使用zabbix结合微信作为主要的告警方式,这样可以及时有效的把告警信息推送到接收人,方便告警的及时处理。微信工作号发送机制可以参考,http://wuhf2015.blog.51cto.com/821300
大飞侠大虾
·
2017-11-26 09:57
zabbix
结合微信
实现
运维自动化
Python WXPY实现微信
监控报警
功能的代码
博主在最近有一个
监控报警
的需求需要完成,然后刚好在学习wxpy这个东西,因此很巧妙的将工作和学习联系在一起。博文中主要使用到的技术设计到Python,Redis,以及Java。
jaycekong
·
2017-10-20 10:04
一次磁盘满的系统故障
大清早的就接到
监控报警
,,提示php进程挂掉了...果断登录到服务器上面查看,发现内存不足4G..果断认为是内存不足引起的,,top了一下,,发现了一个download.php进程占用内存过高,,kill
mstools
·
2017-09-15 11:05
磁盘
故障
系统管理
Cadvisor-InfluxDB-Grafana监控实现
前言这一段时间研究docker监控,上次为大家展示如何让Grafana与influxdb产生联系,这次小编简述docker监控一系列的流程包括
监控报警
措施CadvisorCadvisor提供了对使用容器用户对资源使用的理解
王雪芬-Judy领袖
·
2017-09-13 19:10
数据
性能
云平台多租户
今天和朋友们(部门的运营同事)聊天谈到了我们部门(云平台)接下来要做的事情---实现容器编排以及
监控报警
系统的多租户。朋友就不太理解多租户是什么,和多用户有什么区别,以及我们做这件事情有什么意义?
小秀秀better
·
2017-09-03 01:30
Gitlab CI 自动部署 asp.net core web api 到Docker容器
我希望能找到比较完整的开源解决方案来解决持续集成、
监控报警
、以及扩容和高可用性的问题。是学习和探索的过程分享给大家,也欢迎同行的人交流。
ma524654165
·
2017-08-18 16:28
babel: yet another rpc, but far beyond rpc(下)
研发babel通讯框架,以及其支撑的其他框架,比如
监控报警
等。框架的研发更多的关注与系统底层,比如稳定性、性能、
岂安科技
·
2017-07-21 00:00
python
运维工程师必须掌握的shell技术实战内容
各类监控脚本,内存,磁盘,端口,URL
监控报警
如何监控网站目录是否被篡改,以及站点目录批量被篡改后如何恢复如何开发各类服务(rsync,nginx,mysql)等得启动及停止专业脚本如果开发mysql主从同步
监控报警
以及自从助理不同步脚本一键配置
baishuchao
·
2017-07-03 19:40
运维
工程师
必须掌握
shell
记1次未正确设置replicate-ignore-db参数导致MySQL主从同步异常的问题
今天
监控报警
,从库的Slave_SQL_Running未启动,在处理完故障后,提取一些主要的步骤整理了一下,在自己的测试机上重现了一下当时的故障情况,供大家参考。
leonpenn
·
2017-06-30 09:06
MySQL
docker运行seyren
序seyren是一款开源的
监控报警
系统,采用java开发,从graphite读取指标。下面说一下如何进行docker化运行。
codecraft
·
2017-06-06 00:00
docker
云监控站点
监控报警
异常
云监控站点
监控报警
异常问题描述:客户使用云监控对网站进行监控,收到短信和邮件提醒网站异常,但是实际测网站访问正常,同时云监控控制台显示其中一个监控点异常,另外的监控点正常:问题原因:1、云监控站点监控功能是对服务器站点状态进行监控
我不是九爷
·
2017-05-31 09:37
云监控站点监控报警异常
Spark
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他