E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Zabbix邮件报警故障排查
ZABBIX 邮件报警 SNMP监控Linux Windows
Zabbix邮件报警
1.添加发送邮件服务器SMTP,以QQ为例2.发件服务器配置说明,注意用户认证密码,要用手机短信认证后获取客户端授权码。
AllenZhang2018
·
2019-07-21 23:51
ZABBIX
邮件报警
SNMP监控
分析日志文件
分析日志文件与
故障排查
一、日志文件的概述;1.概念:记录系统和应用程序的运行信息,用于排查和诊断系统的故障;2.linux系统中日志记录的范围:加载内核、init进程启动、启动/etc/rc.d/rc3
一二毛钱
·
2019-07-21 21:08
日志分析
深度好文|TCP连接的状态详解以及
故障排查
我们通过了解TCP各个状态,可以排除和定位网络或系统故障时大有帮助。1、TCP状态了解TCP之前,先了解几个命令:linux查看tcp的状态命令:1)netstat-nat#查看TCP各个状态的数量2)lsof-i:port#可以检测到打开套接字的状况3)sar-nSOCK#查看tcp创建的连接数4)tcpdump-ianytcpport9000#对tcp端口为9000的进行抓包网络测试常用命令;
·
2019-07-18 08:00
深度
tcp
状态
存储互斥失败导致数据丢失的数据恢复成功案例
管理员在在正常工作时为该存储网络又连接了一台Windows2003服务器,结果这台存储突然无法使用了,管理员对存储进行
故障排查
时发现存储虚拟磁盘丢失,分区表丢失。重启该存储后故障依然没有解决。
宋国建
·
2019-07-05 15:23
存储
虚拟磁盘
分区表
(6)二进制文件方式部署Kubernetes高可用集群----------安装Docker Engine
这里,我们没有使用粗暴式的yuminstalldocker安装而是使用二进制文件方式安装docker组件,虽然过程较复杂,但是有利于做定制化需求开发和
故障排查
。
AndOne丶
·
2019-06-25 21:28
Java 性能瓶颈分析工具 你知道几个?
本文介绍了常用的性能分析工具和
故障排查
工具,希望可以帮助开发人员在排查性能问题的时候快速定位到性瓶颈。
dragonpeng2008
·
2019-06-10 08:12
Java
记一次OOM排查过程(入门版)
第一次线上遇到问题,最近也在学jvm,记录一下,算是一个入门版jvm
故障排查
,希望能给新手带来一点干货。
葵续浅笑
·
2019-06-06 10:14
JVM
一次ECS安全组的
故障排查
1、问题说明客户反馈某台阿里云的Centos7的ECS,无法正常访问外网域名,也没法使用外网yum2、排查方法a)检测到8.8.8.8是否正常,经过检测是正常的(说明网络是正常的状态)b)pingwww.aliyun.com,提示无法联通(建议客户添加一个公网dns,223.5.5.5),添加完成后,pingwww.aliyun.com,无法联通c)网络能通,但dns无法连通,怀疑是不是安全组对d
冰冻vs西瓜
·
2019-06-04 21:38
安全组
基础运维
zabbix邮件报警
(四)
处理邮件格式###############################收到邮件报警后,发现是.bin结尾的文件,这样的文件必须要特殊的软件例如iso类软件才能打开,不方便我们阅读这里可以使用dos2unix工具将该格式的文件处理成明文,方便我们在手机端阅读。在zabbix-88上安装软件rpm-ivhdos2unix-6.0.3-7.el7.x86_64.rpm处理一下我们的报警脚本,将报警的
ITCBD_l
·
2019-06-02 15:49
zabbix
zabbix邮件报警
(二)
定义动作(Action)以消防火警为例,当最后一次检测温度达到40度时,产生亮起红灯事件。当红灯亮起是,消防喷头开始洒水,正常来说,洒水一段时间后,可以让火熄灭,温度回到正常值,红灯灭掉。但是如果洒水5分钟后,温度依然在40度以上,这时我们需要采取进一步的行动,例如加大水量,延长喷水时间,并自动拨打119其中,洒水就是一个动作(Action),我们之前已经设定了触发器,但是没有达到触发器的条件后所
ITCBD_l
·
2019-06-02 15:00
zabbix
一个奇葩的docker启动服务
故障排查
环境:os:=====>centos7.4docker:=====>1.13.1docker-compose:=====>1.23.2image:=====>php:7.2-apacheimage:=====>mysql:5.7问题表现:使用同一个docker镜像启动服务,一部分节点启动服务正常,一部分节点容器内服务启动报错!问题起因:公司需要建立官网站点,使用wordpress服务,借助dock
无锋剑
·
2019-05-25 00:29
centos7
docker
xfs
Docker
Rancher
LINUX CENTOS7 配置网卡
LINUXCENTOS7配置网卡文章目录LINUXCENTOS7配置网卡查看网卡信息切换ROOT账户配置网卡重启网卡服务测试连通性
故障排查
查看网卡信息最小化安装CENTOS7时,默认是没有ifconfig
陆小司
·
2019-05-22 17:04
LINUX
Rsync
故障排查
整理(经典)
Rsync
故障排查
整理Rsync服务常见问题汇总讲解:1客户端的错误现象:Noroutetohostrsync服务端开启的iptables防火墙[root@nfs01tmp]#rsync-avz/etc
xiyuxingxia
·
2019-05-21 16:07
Rsync
故障排查整理
Spring Cloud(8):Sleuth和Zipkin的使用
譬如,对于大规模分布式系统,数据存储可分为实时数据和全量数据两部分.实时数据用于
故障排查
(
一清
·
2019-05-20 10:00
后端服务
故障排查
-- dubbo服务超时、线程池耗尽 CPU高负载
文章目录问题现象dubbo线程池耗尽的异常日志cpu占用情况问题排查dubbo线程池耗尽排查cpu高负载排查排查相关命令排查初步定位问题场景验证,确认问题点原因分析调整后验证其他执行的一些优化点参考资料问题现象5-6到5-7,某测试环境我们的服务时常收到调用方反馈,dubbo接口超时。查看后台的错误日志信息,以及环境监控情况。有两个问题,一是dubbo服务通道关闭,线程池耗尽了。调用方表现为服务超
【随风飘流】
·
2019-05-19 12:43
术(知识点)
Rsync服务
故障排查
整理
Rsync服务常见问题汇总讲解:(CentOS6.5操作系统)=========================================================================1、客户端错误信息:Noroutetohostrsync客户端报错信息:[root@localhostscripts]#
[email protected]
::o
heian95tianshi
·
2019-05-16 19:32
rsync错误
rsync报错
rsync故障排查
Linux问题及解决方案
AWS的性能检测服务X-Ray(APM)
虽然微服务或Serverless确实是可以提升业务的持续服务和可靠性,但是业务复杂度,管理难度和管理成本随之提升,如何做好业务
故障排查
,特别是性能和稳定是
Eteng
·
2019-05-11 15:36
AWS的APM
性能检测
代码检测
云计算
ES集群
故障排查
记录
这两天线上的ES集群总是有问题,开始查找原因发现这段时间各个机器的负载都很高,本来希望通过jstack找到一些信息,但居然提示‘Unabletoopensocketfile:targetprocessnotrespondingorHotSpotVMnotloaded’,度娘提示应该是机器很久没有重启了,没办法,只能放弃这种方式。第一步就没有走通。继续查发现几台机器cpu内存都很高,但是硬盘不太对劲
大海之中
·
2019-05-10 15:16
ES
集群
故障
kubernetes node 节点启动报错: No valid private key
kubernetesnode节点启动报错
故障排查
报错场景:kubernetes集群安装部署期间,部署node节点kubelet服务时,执行systemctlstartkubelet,tailf/var/
无锋剑
·
2019-05-05 22:08
No.valid
private
key
Kubernetes
Helm
记一次上线就跪的
故障排查
案例
这个是我很早以前解决的一个案例,其现象是系统每次上线后,20多台机器,总有两三机器,出现假死的情况。如何判断出系统假死?借助的是一个第三方公司运维监控平台;这种情况,前同事称之为的“假死”,需要重新启动系统才能恢复。因为我是新来乍到,觉得这种情况不正常,而且对研发(在这边是研发上线)来说,是一个非常大的上线负担;于是我决定解决一下这个“百年难题”。我亲自上线,果然很快就碰到了假死的机器。我看到机器
猿界汪汪队
·
2019-04-30 09:24
Java
学习总结
故障
假死
死锁
【Junos】手动生成Core-dump文件
常规情况下,当JUNOS进程异常或内核崩溃时,将自动生成一个Core-dump文件,有时
故障排查
的需要下,需手动的去生成一个Core-dump文件。
带刺的板栗
·
2019-04-24 16:20
Juniper
MX
SRX
Switch
Node.js 应用
故障排查
手册 —— 雪崩型内存泄漏问题
摘要:还有一些问题场景下下应用的内存泄漏非常严重和迅速,甚至于在我们的告警系统感知之前就已经造成应用的OOM了,这时我们来不及或者说根本没办法获取到堆快照,因此就没有办法借助于之前的办法来分析为什么进程会内存泄漏到溢出进而Crash的原因了。楔子实践篇一中我们也看到了一个比较典型的由于开发者不当使用第三方库,而且在配置信息中携带了三方库本身使用不到的信息,导致了内存泄漏的案例,实际上类似这种相对缓
阿里云云栖社区
·
2019-04-23 00:00
cdn
require
内存泄漏
node.js
生产环境用Docker?8个常见故障!
—Docker虚拟化故障排错—所有的Docker虚拟化
故障排查
诊
Max_LP
·
2019-04-22 15:02
docker
排错中的直觉,其实源自长期以来积累的经验---记一次网络
故障排查
又是很久一段时间没写什么了,这次带来了一次网络
故障排查
。先把背景描述一下,前一天晚上,客户的网络核心进行割接,用新设备替换老设备。
三角线
·
2019-04-18 15:34
环路
生成树
故障排错
10款常见MySQL高可用方案选型解读
主要负责UCloud云数据库udb的内核
故障排查
工作以及数据库新特性的研发工作。
xudc
·
2019-04-11 22:22
MySQL
MySQL
Node.js 应用
故障排查
手册 —— 大纲与常规问题指标简介
楔子你是否想要尝试进行Node.js应用开发但是又总听人说它不安全、稳定性差,想在公司推广扩张大前端的能力范畴和影响又说服不了技术领导。JavaScript发展到今天,早已脱离原本浏览器的战场,借助于Node.js的诞生将其触角伸到了服务端、PC跨平台客户端方案等各个领域,但是与此同时,JSRuntime对于绝大部分的开发者来说又一如既往的处于黑盒状态——开发者无法感知其运行状态,出现一些性能、内
阿里云云栖社区
·
2019-04-11 00:00
服务器
日志
性能
node.js
Node.js 应用
故障排查
手册 —— 综合性 GC 问题和优化
楔子本章前面两节生产案例分别侧重于单一的CPU高和单一的内存问题,我们也给大家详细展示了问题的定位排查过程,那么实际上还有一类相对更复杂的场景——它本质上是V8引擎的GC引发的问题。简单的给大家介绍下什么是GC,GC实际上是语言引擎实现的一种自动垃圾回收机制,它会在设定的条件触发时(比如堆内存达到一定值)时查看当前堆上哪些对象已经不再使用,并且将这些没有再使用到的对象所占据的空间释放出来。许多的现
阿里云云栖社区
·
2019-04-09 11:12
Node.js
日志
node
Node.js 应用
故障排查
手册 —— 综合性 GC 问题和优化
楔子本章前面两节生产案例分别侧重于单一的CPU高和单一的内存问题,我们也给大家详细展示了问题的定位排查过程,那么实际上还有一类相对更复杂的场景——它本质上是V8引擎的GC引发的问题。简单的给大家介绍下什么是GC,GC实际上是语言引擎实现的一种自动垃圾回收机制,它会在设定的条件触发时(比如堆内存达到一定值)时查看当前堆上哪些对象已经不再使用,并且将这些没有再使用到的对象所占据的空间释放出来。许多的现
阿里云云栖社区
·
2019-04-09 00:00
cpu
性能
日志
node.js
Zabbix邮件报警
设置
1,首先安装mailx组件并且配置好能够通过第三方邮箱发送邮件。yuminstallmailx然后编辑mailx的配置文件vi/etc/mail.rc在末尾添加:
[email protected]
[email protected]
=xxxxxxsetsmtp-auth=login添加
Richard1705
·
2019-04-08 10:56
zabbix
zabbix邮件报警
zabbix
Win 8.1远程桌面报错案例
二、实验环境名称IP操作系统Win8.1-01192.168.31.69Windows8.1中文版Win8.1-02192.168.31.166Windows8.1英文版三、
故障排查
3.1在Win8.1
waqlewaqle
·
2019-04-06 21:49
远程桌面
故障排查
Windows
Node.js 应用
故障排查
手册 —— 正确打开 Chrome devtools
楔子前面的预备章节中我们大致了解了如何在服务器上的Node.js应用出现问题时,从常规的错误日志、系统/进程指标以及兜底的核心转储这些角度来排查问题。这样就引出了下一个问题:我们知道进程的CPU/Memory高,或者拿到了进程Crash后的核心转储,要如何去进行分析定位到具体的JavaScript代码段。其实Chrome自带的Devtools,对于JavaScript代码的上述CPU/Memory
阿里云云栖社区
·
2019-04-04 00:00
cpu
chrome
内存泄漏
node.js
函数
Node.js 应用
故障排查
手册 —— Node.js 性能平台使用指南
楔子前一节中我们借助于Chromedevtools实现了对线上Node.js应用的CPU/Memory问题的排查定位,但是在实际生产实践中,大家会发现Chromedevtools更加偏向本地开发模式,因为显然Chromedevtools不会负责去生成分析问题所需要的Dump文件,这意味着开发者还得额外在线上项目中设置好v8-profiler和heapdump这样的工具,并且通过额外实现的服务来能够
阿里云云栖社区
·
2019-04-03 00:00
配置
性能
javascript
node.js
Node.js 应用
故障排查
手册 —— 利用 CPU 分析调优吞吐量
楔子在我们想要新上线一个Node.js应用之前,尤其是技术栈切换的第一个Node.js应用,由于担心其在线上的吞吐量表现,肯定会想要进行性能压测,以便对其在当前的集群规模下能抗住多少流量有一个预估。本案例实际上正是在这样的一个场景下,我们想要上线Node.js技术栈来做前后端分离,那么刨开后端服务的响应QPS,纯使用Node.js进行的模板渲染能有怎么样的表现,这是大家非常关心的问题。本书首发在G
阿里云云栖社区
·
2019-04-02 00:00
模块化
性能
函数
node.js
javascript
Node.js 应用
故障排查
手册 —— 冗余配置传递引发的内存溢出
楔子前面一小节我们以一个真实的压测案例来给大家讲解如何利用Node.js性能平台生成的CPUProfile分析来进行压测时的性能调优。那么与CPU相关的问题相比,Node.js应用中由于不当使用产生的内存问题是一个重灾区,而且这些问题往往都是出现在生产环境下,本地压测都难以复现,实际上这部分内存问题也成为了很多的Node.js开发者不敢去将Node.js这门技术栈深入运用到后端的一大阻碍。本节将以
阿里云云栖社区
·
2019-04-01 00:00
配置
内存泄漏
性能
node.js
javascript
一次网关冲突导致的网络
故障排查
1、背景在下是运维网络的一名技术人员,半路出家接触比较多的是华为和H3C的三层园区交换机。这里是排除一次网关相关的问题。这是一个平常的上午,小明正在巡检机房。突然接到个的电话,电话里说,“上面要求的要马上处理.......”,好吧一个好好的上午就这样被破坏了。终于是汗流浃背的跑到现场,在一群人七嘴八舌的一通陈述中大致明白了。有一个机房的设备要接入我们新开的网段中(即下文中的172.100.2.0/
CPD211
·
2019-03-28 23:00
日常排障
关于mobaxterm连接工具Linux使用tree命令乱码
文章目录
故障排查
解决修改字符集文件方法查看是否恢复正常故障本人使用的是MobaXtermPersonal11.1版本,在使用的过程中发现连接上服务器后,查看日志或者使用tree命令的时候显示中文乱码,一开始以为是连接工具的问题
GeekShuai
·
2019-03-27 09:25
杂项知识
【干货资料 】简单的交换机光模块
故障排查
步骤
交换机光模块
故障排查
步骤1、检查光纤跳线是否与光模块相符:常见的多模光纤跳线有橙色、灰色和青绿色,而且一般印有62.5/125u或50/125u字样;单模光纤跳线通常有×××和蓝色等,一般印有9/125u
qq5c36e07e0b753
·
2019-03-22 14:41
光模块故障
交换机光模块
电口模块
故障排查
——CPU使用率过高
本篇将介绍CPU使用率过高的处理方案。CPU使用率CPU使用率过高,跟内存和进程都有关系,例如复杂运算,一般都会导致CPU升高。使用top命令查看(按1可以查看多核的CPU使用情况):产生原因第三行CPU占用率根据类型有以下几种情况:(us)user:CPU在低nice值(高优先级)用户态所占用的时间(nice0)。默认新启动的进程nice=0,是不会计入这里的,除非手动通过renice或者set
mUncleWang
·
2019-03-10 12:08
Linux
监控和故障
故障排查
——负载Load过高
本篇将介绍负载过高的处理方案。负载在Linux系统中,uptime、w、top等命令都会有系统平均负载loadaverage的输出:产生原因负载受到多个因素影响,带宽、系统硬件配置、内核参数、应用程序等。排查步骤在查看了top命令所显示的状态后,需要依据其来做优化,但top命令显示的只是表象,所以我们可以通过iostat或者vmstat命令进一步的观察。查看系统负载procsr列表示运行和等待cp
mUncleWang
·
2019-03-07 23:20
Linux
监控和故障
Linux Centos6.9常用基础命令
过十分钟后重启shutdown-r20:35#20:35分重启关机命令:halt#立刻关机poweroff#立刻关机shutdown-hnow#立刻关机(root用户使用)shutdown-h10#十分钟后关机
故障排查
王·先生
·
2019-03-07 15:49
Linux
Centos6.9基础学习之路
记一次Nagios服务启动失败的
故障排查
故障场景:一台装有Nagios服务的CentOS重启后,Nagios服务启动失败,报错信息是没有这个目录cfg_dir=/etc/nagios/conf.d排障过程:1、我一看“嘿,谁改这一句,配置文件目录应该是objects吧”想当然地将这个参数改成了cfg_dir=/etc/nagios/objects再次启动,还是报错!看提示是说notify-host-by-email这个值重复了。2、运行
辉晖飛
·
2019-03-07 14:55
Nagios
故障
更新
Linux
记一次线上DPDK-LVS的
故障排查
背景我们内部基于dpdk自研的高性能负载均衡器dpvs已经在多个机房部署上线,运行正常,但近期有多个金融相关的业务反馈,服务数据包在经过dpvs转发后,会出现hang住的情况。问题dpvs已经在多个机房上线,运行时间已超过半年,为何突然有业务反馈异常反馈问题的业务多与金融区相关(金融区由于其特殊性,会额外增加安全方面的加固策略)为什么问题表现均为服务hang住问题排查首先,我们怀疑与dpvs或与金
twohearts0
·
2019-03-07 10:17
DPDK
LVS
故障
配电房维保助学校避免配电柜故障
配电房在运行过程中出现小事故在所难免,只需要通过配电房维保来对
故障排查
修复即可。在配电房中,配电柜事故发生几率是比较高的,而为了应对事故发生这种突发情况,需要对其进行排查修复。
游倪君
·
2019-02-28 11:23
故障排查
-linux命令测试端口连通性
方法一:telnet法预置条件:安装telnetstep1、rpm-qatelnet-server(无输出表示telnet-server未安装,则执行step2;否则执行step3)step2、yum-yinstalltelnet-server(安装telnet-server)step3、rpm-qatelnet(无输出表示telnet未安装,则执行step4,否则执行step5)step4、yu
luvsic
·
2019-02-17 19:35
Skype for Business Online 中给个别用户拨号通话时出现故障
一般情况下,我们都会先通过日志进行
故障排查
。如果是本地部署的SFB环境,由于IT暂时拿不到客户端信息,就需要先从服务器端查看。
ljb_job
·
2019-02-01 10:58
SFB
Online
Office
365
网络
故障排查
常见方法
网络故障的诊断在故障不明的情况下,应先诊断硬件故障,后诊断软件故障;在突发网络故障时,合理是首先查看本机网络硬件是否工作正常。常见排障命令telnet:确认目标应用端口是否有监听。ping:确认源地址到目的地址之间是否可达。tracert:跟踪源地址到目的地址中间经过的所有路由器。常用排障步骤网络故障一般表现为某个应用没法访问。基本思路是先排除应用本身的问题,然后定位网络故障点。一般排障步骤如下:
张嘉木
·
2019-01-10 15:31
运维
网络
MySQL DeadLock
故障排查
全过程记录
【作者】刘博:携程技术保障中心数据库高级经理,主要关注Sqlserver和Mysql的运维和故障处理。【环境】版本号:5.6.21隔离级别:REPEATABLEREAD【问题描述】接到监控报警,有一个线上的应用DeadLock报错,每15分钟会准时出现,报错统计如下图:登录Mysql服务器查看日志:mysql>showengineinnodbstatus\G***(1)TRANSACTION:TR
携程DBA
·
2019-01-03 10:22
kubernetes部署dashboard可视化插件
用户可以用KubernetesDashboard部署容器化的应用、监控应用的状态、执行
故障排查
任务以及管理Kubernetes各种资源。
willblog
·
2019-01-02 12:37
kubernetes
MySQL DeadLock
故障排查
过程
【作者】刘博:携程技术保障中心数据库高级经理,主要关注Sqlserver和Mysql的运维和故障处理。【环境】版本号:5.6.21隔离级别:REPEATABLEREAD【问题描述】接到监控报警,有一个线上的应用DeadLock报错,每15分钟会准时出现,报错统计如下图:登录Mysql服务器查看日志:mysql>showengineinnodbstatus\G***(1)TRANSACTION:TR
携程DBA
·
2019-01-02 11:00
Oracle 11g监听的
故障排查
虚机数据库服务器oracle11G的监听意外中止,报错如下在虚机上执行lsnrctlstart,问题解决。1、当连接异常时,可以通过分析监听日志来查找线索〜[test]$find$ORACLE_HOME-namelistener.log/opt/64bit/oracle/11.2.0/log/diag/tnslsnr/sinrndvud062/listener/trace/listener.log
xjsunjie
·
2018-12-27 16:18
监听
排查
数据库与大数据
上一页
20
21
22
23
24
25
26
27
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他