E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Zabbix邮件报警故障排查
线上问题总结
记一次线上问题→事务去哪了https://www.cnblogs.com/youzhibing/p/12071391.html记一次线上
故障排查
https://zhuanlan.zhihu.com/p/
奥兰治的威廉
·
2020-07-02 14:33
java
web
Zabbix邮件报警
设置(已解决邮件内容为附件的问题)
环境系统:CentOS7Zabbix版本:Zabbix3.4.4安装邮件发送工具mailx因为此处选择了mailx作为邮件发送工具,所以关闭其他自带的邮件服务,在安装zabbix的服务器上执行以下命令:servicesendmailstop##关闭sendmailsystemctldisablesendmail.service##禁止开机启动sendmailservicepostfixstop##
OUT__MAN
·
2020-07-02 14:48
Zabbix
Linux CentOS7
Zabbix邮件报警
通过QQ邮件发送邮件的问题解决方案
参考自:https://blog.csdn.net/djhsun/article/details/78731683环境CentOS7+QQ个人邮箱:smtp..qq.com(QQ企业邮箱:smtp.exmail.qq.com)#POP3/SMTP协议接收邮件服务器:pop.exmail.qq.com,使用SSL,端口号995发送邮件服务器:smtp.exmail.qq.com,使用SSL,端口号4
两苹果
·
2020-07-02 08:51
操作系统
linux
VMware
系统安全
运维杂谈
Linux CentOS7
Zabbix邮件报警
通过QQ企业邮箱发送邮件的问题解决方案
环境CentOS7+QQ个人邮箱:smtp..qq.com(QQ企业邮箱:smtp.exmail.qq.com)#POP3/SMTP协议接收邮件服务器:pop.exmail.qq.com,使用SSL,端口号995发送邮件服务器:smtp.exmail.qq.com,使用SSL,端口号465#海外用户可使用以下服务器接收邮件服务器:hwpop.exmail.qq.com,使用SSL,端口号995发送
leonnew
·
2020-07-02 07:54
疑难杂症
(收藏)JAVA 线上
故障排查
全套路
线上故障主要会包括CPU、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top三连,然后依次jstack、jmap伺候,具体问题具体分析即可。CPU一般来讲我们首先会排查CPU方面的问题。CPU异常往往还是比较好定位的。原因包括业务逻辑问题(
jackyrongvip
·
2020-07-02 05:03
JAVA
线上
故障排查
(2) - Java应用故障之堆溢出OOM问题及排查方案
以下是用于测试OOM的测试代码:publicclassHeapMemUseTest{publicstaticvoidmain(String[]args){StringBuildersb=newStringBuilder();while(true){sb.append(System.currentTimeMillis());}}}这段代码非常简单,其目的就是为了模拟OOM,将其编译后,通过以下命令运
冯立彬
·
2020-07-01 23:19
JAVA实用笔记
OOM
内存溢出
MAT
PHP服务
故障排查
之路
起因,使用人员反馈出现转圈(查询慢)和登录出现504错误。第一个判断就是PHP进程被占满了,服务处于繁忙状态,Nginx的请求PHP未能及时回应,用了最简单粗暴的方式,重启php-fpm服务。重启服务后正常,并调整pm.max_children参数,过了一个星期后又出现,一样的现象。再次出现后,根据网上的资料,优化Nginx和php-fpm参数,详细如下:php-fpm.confpm.max_ch
鱼天翱
·
2020-07-01 23:31
PHP
Nginx
php
故障
Node.js 应用
故障排查
手册 —— 大纲与常规问题指标简介 ...
楔子你是否想要尝试进行Node.js应用开发但是又总听人说它不安全、稳定性差,想在公司推广扩张大前端的能力范畴和影响又说服不了技术领导。JavaScript发展到今天,早已脱离原本浏览器的战场,借助于Node.js的诞生将其触角伸到了服务端、PC跨平台客户端方案等各个领域,但是与此同时,JSRuntime对于绝大部分的开发者来说又一如既往的处于黑盒状态——开发者无法感知其运行状态,出现一些性能、内
客服小羊
·
2020-07-01 21:40
Node.js 应用
故障排查
手册 —— 冗余配置传递引发的内存溢出 ...
楔子前面一小节我们以一个真实的压测案例来给大家讲解如何利用Node.js性能平台生成的CPUProfile分析来进行压测时的性能调优。那么与CPU相关的问题相比,Node.js应用中由于不当使用产生的内存问题是一个重灾区,而且这些问题往往都是出现在生产环境下,本地压测都难以复现,实际上这部分内存问题也成为了很多的Node.js开发者不敢去将Node.js这门技术栈深入运用到后端的一大阻碍。本节将以
客服小羊
·
2020-07-01 21:40
Node.js 应用
故障排查
手册 —— 综合性 GC 问题和优化 ...
楔子本章前面两节生产案例分别侧重于单一的CPU高和单一的内存问题,我们也给大家详细展示了问题的定位排查过程,那么实际上还有一类相对更复杂的场景——它本质上是V8引擎的GC引发的问题。简单的给大家介绍下什么是GC,GC实际上是语言引擎实现的一种自动垃圾回收机制,它会在设定的条件触发时(比如堆内存达到一定值)时查看当前堆上哪些对象已经不再使用,并且将这些没有再使用到的对象所占据的空间释放出来。许多的现
客服小羊
·
2020-07-01 21:39
Linux(1) Linux系统线上
故障排查
的几种技巧
然而,性能优化、
故障排查
也是软件系统中最有挑战的工作之一,甭管看了多少资料和书,一旦涉及到解决具体问题,照样儿一脸懵逼,比如:流量高峰期,服务器CPU使用率过高报警,你登录Linux上去top完之后,却不知道怎么进一步定位
大神,快来碗里
·
2020-07-01 21:00
linux
MySQL
故障排查
Linux服务器重启后发现Mysql无法启动了故障一:启动故障错误提示:Can'tconnecttolocalMySQLserverthroughsocket'/var/lib/mysql/mysql.sock'解决方案:1:尝试重启mysql服务器,是否出现同样错误2:如出现同样错误,则删除mysql.sock文件后在重启rm-rf/usr/local/mysql/mysql.socksyste
我真的不是ZKC
·
2020-07-01 15:29
JAVA线上
故障排查
全套路
文章目录一、CPU: ①使用jstack分析cpu问题 ②频繁gc ③上下文切换二、磁盘:三、内存: ①堆内内存 1、OOM ⅰ、Exceptioninthread"main"java.lang.OutOfMemoryError:unabletocreatenewnativethread ⅱ、Exceptioninthread"main"java.lang.Out
NarutoConanKing
·
2020-07-01 12:29
java
故障处理
PHP性能问题诊断与排查
PHP性能问题诊断与排查最近PHP性能问题频发,share一下最近对phpPerfromancetracing思路和方法便于大家诊断和
故障排查
:宏观层面的监测工具大家都比较熟悉主要...最近PHP性能问题频发
KISSING_hu
·
2020-07-01 10:03
故障排查
通过 profiling 定位 golang 性能问题 - 内存篇
本文会以go语言的pprof工具为例,分享两个线上性能
故障排查
过程,希望能通过本文使大家对性能分析有更深入的理解。在遇到线上的性能问题时,
滴滴技术
·
2020-07-01 09:53
线上linux系统
故障排查
之二:内存占用过高
主要分析系统内存占用过高的排查方法。在Java开发中,对经常看到这两种异常:java.lang.OutOfMemoryError:PermGenspacejava.lang.OutOfMemoryError:Javaheapspace一、异常出现的原因1.Java.lang.OutOfMemoryError:PermGenspacePermGenspace全称是PermanentGeneratio
lanysong
·
2020-07-01 07:29
java
dpdk-lvs的一次线上
故障排查
报告
本文记录了dpdk-lvs集群的一次线上
故障排查
过程,排查思路可供读者参考。
weixin_34125592
·
2020-07-01 05:11
Node.js 应用
故障排查
手册 —— Node.js 性能平台使用指南 ...
楔子前一节中我们借助于Chromedevtools实现了对线上Node.js应用的CPU/Memory问题的排查定位,但是在实际生产实践中,大家会发现Chromedevtools更加偏向本地开发模式,因为显然Chromedevtools不会负责去生成分析问题所需要的Dump文件,这意味着开发者还得额外在线上项目中设置好v8-profiler和heapdump这样的工具,并且通过额外实现的服务来能够
客服小羊
·
2020-07-01 02:45
故障排查
故障排查
故障排查
1、说明2、问题分类2.1、线上服务突然OOM、线上服务突然变慢、线上服务突然出现大量报警2.2线上出现sql报警2.3线上某个接口出现异常2.4线上机器Load很高1、说明本文档的宗旨是为了帮助大家在一些常见类型的故障处理流程中
CocoaZhao
·
2020-07-01 01:55
JAVA
Linux 磁盘空间占满故障解决方法
故障排查
:使用命令查看磁盘使用量#使用人类可读的格式(预设值是不加这个选项的...)df-h#--inodes列出inode资讯,不列出已使用blockdf-i#查看当前目录下各个文件及目录占用空间大小
Keith003
·
2020-07-01 01:30
Linux
线上
故障排查
——drools规则引擎使用不当导致oom
事件回溯1、7月26日上午11:34,告警邮件提示:tomcat内存使用率连续多次超过90%;2、开发人员介入排查问题,11:40定位到存在oom问题,申请运维拉取线上tomcat内存快照dump;3、开发人员担心服务抗不过下午的业务高峰期,让运维在中午低谷期间重启tomcat;4、11:45,运维人员重启tomcat,内存使用回落。事件分析1、根据监控历史数据,发现7月10日后,内存逐步上升,且
weixin_30374009
·
2020-07-01 00:39
MongoDB副本集replica set(五)--
故障排查
(一)查看副本集状态要查看副本集状态及每个成员的状态,可以连接到主节点,使用rs.status()命令查看:rstest:PRIMARY>rs.status(){"set":"rstest","date":ISODate("2020-06-30T15:06:44.586Z"),"myState":1,"term":NumberLong(15),"syncingTo":"","syncSourceH
gegeman
·
2020-06-30 19:00
经验分享:C/S系统
故障排查
之服务器端口telnet失败
(在过去的10+年基于ESFramework做了很多的C/S系统,也协助客户解决了诸多开发和运行时的技术问题,个人觉得这些历史经验是非常宝贵的,接下来我会将这些经验逐步分享出来,希望对碰到类似问题的人有所启发和帮助。)telnet命令的主要作用是与目标端口进行TCP连接(即完成TCP三次握手)。当服务端启动后,但是telnet其监听的端口,却失败了。或者,当服务端运行了一段时间后,突然其监听的端口
zhuweisky
·
2020-06-30 17:33
C#专栏
Java线上应用
故障排查
线上故障主要2种:CPU利用率很高,内存占用率很大一、CPU利用率很高1.top查询那个进程CPU使用率高2.显示进程列表ps-mppid-oTHREAD,tid,time找到了耗时最高的线程28802,占用CPU时间快两个小时了!其次将需要的线程ID转换为16进制格式:printf"%x\n"tid最后打印线程的堆栈信息:jstackpid|greptid-A30从Threaddump日志中可以
zhu592665411
·
2020-06-30 17:18
Java 线上
故障排查
完整套路
线上故障主要会包括CPU、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top三连,然后依次jstack、jmap伺候,具体问题具体分析即可。CPU一般来讲我们首先会排查CPU方面的问题。CPU异常往往还是比较好定位的。原因包括业务逻辑问题(
民国周先生
·
2020-06-30 16:36
微服务架构--链路追踪(Nginx篇)
微服务架构虽好,但同时也带来了很多挑战,其中
故障排查
就是其需要解决的挑战之一。那么,如何在很多个应用和实例中找到故障发生的根源呢?
zhangge3663
·
2020-06-30 13:03
NGINX
k8s踩坑(三)、kubeadm证书/etcd证书过期处理
k8sapi无法调取的现象,使用kubectl命令获取资源均返回如下报错:Unabletoconnecttotheserver:x509:certificatehasexpiredorisnotyetvalid
故障排查
查看
ywq935
·
2020-06-30 11:57
kubernetes
问题
Kubernetes踩坑(二): Service IP(LVS)间断性TCP连接
故障排查
问题阶段(一):用户反应某个redis使用卡顿,连接该redis服务使用的是svc代理,即ipvssnat的方式,ipvsadm-L发现,VIP收到的6379端口的数据包,会以rr的方式分别转发到pod的806379端口上,相当于会有50%的丢包,不卡才怪:#ipvsadm|grep-210.108.152.210TCP10.108.152.210:6379rr->172.26.6.185:htt
ywq935
·
2020-06-30 11:57
kubernetes
网络
问题
Hadoop原理与安装
Hadoop的两大核心原理:MapReduce和HDFS,在安装Hadoop之前一定要深入的理解这些原理,才有助于安装过程中的
故障排查
以及以后使用中的问题分析。
牛麦康纳
·
2020-06-30 07:02
Java
网络/运维工程面试题三
运维是指对大型组织已经建立好的网络软硬件的维护,就是要保证业务上的上线和运作的正常,在运转的过程中,对它进行维护,是集合了网络、系统、数据库、安全、监控于一身的技术运维又包含多种,其中应用运维,是用运维工具为业务上线、维护和
故障排查
和处理系统运维
wuyaxin97
·
2020-06-30 06:42
网络工程
[kubernetes]
故障排查
istio
[kubernetes]
故障排查
istio问题是这样的,部署了自己公司的服务,发现相关的的pods都只有二分之一个容器是READY的。
爷来辣
·
2020-06-30 04:05
kubernetes
常见网络
故障排查
这是今天在翻看《linux系统命令及shell脚本》一书中看到的,觉得挺受用的,特摘录下来。还想到之前在网络相关的一些命令,自己有简单的写过:查看网络是否正常,一般先确保以下设置是否正确1、网线是否连接正确2、ip地址和子网掩码是否设置正确(ifconfig)3、默认网关是否设置正确(route)4、域名服务器是否设置正确以下摘录内容:第一步是要确认网卡本身是否能正常工作?利用ping工具可以确认
慎思明辨
·
2020-06-29 21:56
网络
直播CDN架构内幕
直播整体介绍文章主要从直播CDN的业务介绍,CDN整体技术架构,
故障排查
,CDN系统质量评估来做介绍分析直播从技术架构上讲主要分以下三类:传统三层的CDN架构:1推流边缘—2推流区域—3源站----2拉流区域
思心
·
2020-06-29 21:11
nginx-rtmp
nginx-rtmp
服务器
故障排查
方法总结
服务器
故障排查
方法总结问题描述:每当出现网站访问不了的时候,估计应该就是服务器出现故障了,这个时候大部分情况都是属于数据库出现问题。
wjtlht928
·
2020-06-29 19:13
Linux
Nginx返回400 Bad Request
故障排查
系统环境服务端:K8s集群使用NginxIngressController,并且支持http2客户端:golangversion1.9.2,且使用http2故障现象Nginx偶发400BadRequest,绝大部分请求正常返回200故障排除步骤(1)故障复现使用golanghttp2client,每个请求post相同的数据,直到response400;查询nginx日志,response为400时
wheatcookie
·
2020-06-29 18:34
nginx
vsphere
故障排查
vsphere
故障排查
vsphere
故障排查
1vSphere排错思想1.1
故障排查
逻辑1.2常规故障分层2虚拟机的
故障排查
2.1快照问题修复2.1.1解决CID不匹配问题2.1.2vss导致snapshot
迷鹿milu
·
2020-06-29 17:46
10款常见MySQL高可用方案选型解读
主要负责UCloud云数据库udb的内核
故障排查
工作以及数据库新特性的研发工作。
阿里云_云栖社区
·
2020-06-29 17:28
Linux网络
故障排查
文章目录1、链路是否连通2、网卡和ip是否正常3、是否正确配置了网关4、测试DNS是否可用5、远程主机是否开放端口6、使用nmap工具检测端口开放情况7、网络慢排查:iftop1、链路是否连通目的:检查网卡与网络是否物理连通,网线是否插好且连接可用,很多时候不能立刻到机房确定物理连接#检查网卡与网络是否物理连通,网线是否插好且连接可用,很多时候不能立刻到机房确定物理连接[root@linux-no
hsw Come on
·
2020-06-29 17:13
linux
JAVA 线上
故障排查
全套路
作者:fredalxin线上故障主要会包括CPU、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top三连,然后依次jstack、jmap伺候,具体问题具体分析即可。CPU一般来讲我们首先会排查CPU方面的问题。CPU异常往往还是比较好定位的
从事Java
·
2020-06-29 16:46
Linux运维常见
故障排查
和处理的技巧汇总
作为Linux运维,工作中多多少少会遇见这样那样的问题或故障,从中总结经验,查找问题,汇总并分析故障的原因,这是一个Linux运维工程师良好的习惯。每一次技术的突破,都经历着苦闷,伴随着快乐,可我们还是执着的继续努力,从中也积累了更多的经验。下面汇总了可能出现的故障及解决方法,看看你是否遇到过?并对你有帮助?第一:常见问题解决集锦1.shell脚本不执行问题:某天研发同事找我说帮他看看他写的she
_微疼
·
2020-06-29 15:45
使用kubeadm方式部署集群时,Node节点一直处于NotReady状态、coredns处于pending状态的解决思路与
故障排查
在官方文档中https://kubernetes.io/zh/docs/setup/production-environment/tools/kubeadm/troubleshooting-kubeadm/存在以下说明:也就是说,造成coredns组件处于pending状态的主要原因是网络插件没有安装好。只有当网络插件安装后,coredns组件才会正常启用。这也就解释了为什么节点会一直处于NotR
Shawn-Li
·
2020-06-29 14:36
Kubernetes
故障排查
与优化深入:企业级NginxWeb服务优化
nginx性能优化nginx安全优化一、Nginx基本安全优化1.1调整参数隐藏Nginx软件版本号信息一般来说,软件的漏洞都和版本有关,这个很像汽车的缺陷,同一批次的要有问题就都有问题,别的批次可能就都是好的。因此,我们应尽量隐藏或消除Web服务对访问用户显示各类敏感信息(例如Web软件名称及版本号等信息),这样恶意的用户就很难猜到他攻击的服务器所用的是否有特定漏洞的软件,或者是否有对应漏洞的某
daisy_118
·
2020-06-29 08:07
运维 常见
故障排查
常见名词含义1、IP地址IP地址是个32位的2进制数,是个虚拟的地址,通常我们把IP地址的每8位翻译成一个10进制数,然后用“.”分隔开来,所以也称之为点分十进制表示法。比如说192.168.1.1、10.1.1.2等。IP地址分为A\B\C\D\E五类,同时也有公有地址跟私有地址的区分。这里只讨论公有与私有的区分。公有地址的含义是可以在INTERNET上传输的地址,反之不能在INTERNET上传
⁶⁶⁶俺有两猴⁶⁶⁶
·
2020-06-29 07:14
APM应用性能管理监控使用体验--appdynamics
本文主要包含以下4部分内容注册AppDynamicsSaas账号安装监控代理Agent监控效果简介使用AppDynamics进行
故障排查
注册AppDynamicsSaas账号AppDyn
凌襄公子
·
2020-06-29 03:36
AppDynamics
ELK-elasticsearch
故障排查
篇
前言在生产上使用了ELK+filebeat,filebeat负责收集日志,Logtash负责过滤日志并输出到Elasticsearch,Elasticsearch根据Logstash的输出做索引,Kibana负责调用Elasticsearch的API接口展示数据。架构ELK是部署在单独的一台服务器上,负责收集日志的客户端总共是16台。故障登录Kibana查看信息的时候出现以下信息,说明Elasti
陈嘟嘟
·
2020-06-28 22:44
日志
Linux启动
故障排查
和修复技巧
一个执着于技术的公众号我发现Linux系统在启动过程中会出现一些故障,导致系统无法正常启动,我在这里写了几个应对单用户模式、GRUB命令操作、Linux救援模式的故障修复案例帮助大家了解此类问题的解决方法。(一)单用户模式Linux系统提供了单用户模式(类似Windows安全模式),可以在最小环境中进行系统维护。在单用户模式(运行级别1)中,Linux引导进入根shell,网络被禁用,只有少数进程
开源Linux
·
2020-06-28 21:39
kubernetes
故障排查
pod
故障排查
调试pod的第一步是看一下这个pod的信息,用如下命令查看一下pod的当前状态和最近的事件:$kubectldescribepods${POD_NAM查看一下pod中的容器所处的状态。
韩先超
·
2020-06-28 21:44
一些好用的开源监控工具汇总
编辑|张婵一些好用且开源的监控工具监控系统是整个IT架构中的重中之重,小到
故障排查
、问题定位,大到业务预测、运营管理,都离不开监控系统,可以说一个稳定、健康的IT架构中必然会有一个可信赖的监控系统。
高效开发运维
·
2020-06-28 19:47
网络排查思路
然而在实际
故障排查
过程中,这种分层方法往往被忽略,导致
故障排查
效率降低。两种逐层排查方式OSI的层次结构为管理员分析和排查故障提供了非常好的组织方式。由于各层相对独立,按层排查能够有
weixin_34292402
·
2020-06-28 16:35
linux运维系统
故障排查
思路及常见故障处理
一linux系统故障的一般处理思路报错信息--->查阅日志文件--->分析定位问题--->解决问题。二linux系统无法启动原因及解决系统无法启动的原因很多,常见的有下面几种情况:1文件系统被破坏,常常因断电和非法关机引起文件系统结构不一致。修复方法是用fsck命名强制修复,进入单用户模式或者交互界面,按提示进入修改模式中,卸载对应的问题磁盘,然后用fsck命令修复,无法恢复的数据会存放在lost
weixin_34279184
·
2020-06-28 15:41
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他