E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
IT故障排查
通过 profiling 定位 golang 性能问题 - 内存篇
本文会以go语言的pprof工具为例,分享两个线上性能
故障排查
过程,希望能通过本文使大家对性能分析有更深入的理解。在遇到线上的性能问题时,
滴滴技术
·
2020-07-01 09:53
线上linux系统
故障排查
之二:内存占用过高
主要分析系统内存占用过高的排查方法。在Java开发中,对经常看到这两种异常:java.lang.OutOfMemoryError:PermGenspacejava.lang.OutOfMemoryError:Javaheapspace一、异常出现的原因1.Java.lang.OutOfMemoryError:PermGenspacePermGenspace全称是PermanentGeneratio
lanysong
·
2020-07-01 07:29
java
dpdk-lvs的一次线上
故障排查
报告
本文记录了dpdk-lvs集群的一次线上
故障排查
过程,排查思路可供读者参考。
weixin_34125592
·
2020-07-01 05:11
Node.js 应用
故障排查
手册 —— Node.js 性能平台使用指南 ...
楔子前一节中我们借助于Chromedevtools实现了对线上Node.js应用的CPU/Memory问题的排查定位,但是在实际生产实践中,大家会发现Chromedevtools更加偏向本地开发模式,因为显然Chromedevtools不会负责去生成分析问题所需要的Dump文件,这意味着开发者还得额外在线上项目中设置好v8-profiler和heapdump这样的工具,并且通过额外实现的服务来能够
客服小羊
·
2020-07-01 02:45
故障排查
故障排查
故障排查
1、说明2、问题分类2.1、线上服务突然OOM、线上服务突然变慢、线上服务突然出现大量报警2.2线上出现sql报警2.3线上某个接口出现异常2.4线上机器Load很高1、说明本文档的宗旨是为了帮助大家在一些常见类型的故障处理流程中
CocoaZhao
·
2020-07-01 01:55
JAVA
Linux 磁盘空间占满故障解决方法
故障排查
:使用命令查看磁盘使用量#使用人类可读的格式(预设值是不加这个选项的...)df-h#--inodes列出inode资讯,不列出已使用blockdf-i#查看当前目录下各个文件及目录占用空间大小
Keith003
·
2020-07-01 01:30
Linux
线上
故障排查
——drools规则引擎使用不当导致oom
事件回溯1、7月26日上午11:34,告警邮件提示:tomcat内存使用率连续多次超过90%;2、开发人员介入排查问题,11:40定位到存在oom问题,申请运维拉取线上tomcat内存快照dump;3、开发人员担心服务抗不过下午的业务高峰期,让运维在中午低谷期间重启tomcat;4、11:45,运维人员重启tomcat,内存使用回落。事件分析1、根据监控历史数据,发现7月10日后,内存逐步上升,且
weixin_30374009
·
2020-07-01 00:39
MongoDB副本集replica set(五)--
故障排查
(一)查看副本集状态要查看副本集状态及每个成员的状态,可以连接到主节点,使用rs.status()命令查看:rstest:PRIMARY>rs.status(){"set":"rstest","date":ISODate("2020-06-30T15:06:44.586Z"),"myState":1,"term":NumberLong(15),"syncingTo":"","syncSourceH
gegeman
·
2020-06-30 19:00
经验分享:C/S系统
故障排查
之服务器端口telnet失败
(在过去的10+年基于ESFramework做了很多的C/S系统,也协助客户解决了诸多开发和运行时的技术问题,个人觉得这些历史经验是非常宝贵的,接下来我会将这些经验逐步分享出来,希望对碰到类似问题的人有所启发和帮助。)telnet命令的主要作用是与目标端口进行TCP连接(即完成TCP三次握手)。当服务端启动后,但是telnet其监听的端口,却失败了。或者,当服务端运行了一段时间后,突然其监听的端口
zhuweisky
·
2020-06-30 17:33
C#专栏
Java线上应用
故障排查
线上故障主要2种:CPU利用率很高,内存占用率很大一、CPU利用率很高1.top查询那个进程CPU使用率高2.显示进程列表ps-mppid-oTHREAD,tid,time找到了耗时最高的线程28802,占用CPU时间快两个小时了!其次将需要的线程ID转换为16进制格式:printf"%x\n"tid最后打印线程的堆栈信息:jstackpid|greptid-A30从Threaddump日志中可以
zhu592665411
·
2020-06-30 17:18
Java 线上
故障排查
完整套路
线上故障主要会包括CPU、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top三连,然后依次jstack、jmap伺候,具体问题具体分析即可。CPU一般来讲我们首先会排查CPU方面的问题。CPU异常往往还是比较好定位的。原因包括业务逻辑问题(
民国周先生
·
2020-06-30 16:36
微服务架构--链路追踪(Nginx篇)
微服务架构虽好,但同时也带来了很多挑战,其中
故障排查
就是其需要解决的挑战之一。那么,如何在很多个应用和实例中找到故障发生的根源呢?
zhangge3663
·
2020-06-30 13:03
NGINX
k8s踩坑(三)、kubeadm证书/etcd证书过期处理
k8sapi无法调取的现象,使用kubectl命令获取资源均返回如下报错:Unabletoconnecttotheserver:x509:certificatehasexpiredorisnotyetvalid
故障排查
查看
ywq935
·
2020-06-30 11:57
kubernetes
问题
Kubernetes踩坑(二): Service IP(LVS)间断性TCP连接
故障排查
问题阶段(一):用户反应某个redis使用卡顿,连接该redis服务使用的是svc代理,即ipvssnat的方式,ipvsadm-L发现,VIP收到的6379端口的数据包,会以rr的方式分别转发到pod的806379端口上,相当于会有50%的丢包,不卡才怪:#ipvsadm|grep-210.108.152.210TCP10.108.152.210:6379rr->172.26.6.185:htt
ywq935
·
2020-06-30 11:57
kubernetes
网络
问题
Hadoop原理与安装
Hadoop的两大核心原理:MapReduce和HDFS,在安装Hadoop之前一定要深入的理解这些原理,才有助于安装过程中的
故障排查
以及以后使用中的问题分析。
牛麦康纳
·
2020-06-30 07:02
Java
网络/运维工程面试题三
运维是指对大型组织已经建立好的网络软硬件的维护,就是要保证业务上的上线和运作的正常,在运转的过程中,对它进行维护,是集合了网络、系统、数据库、安全、监控于一身的技术运维又包含多种,其中应用运维,是用运维工具为业务上线、维护和
故障排查
和处理系统运维
wuyaxin97
·
2020-06-30 06:42
网络工程
[kubernetes]
故障排查
istio
[kubernetes]
故障排查
istio问题是这样的,部署了自己公司的服务,发现相关的的pods都只有二分之一个容器是READY的。
爷来辣
·
2020-06-30 04:05
kubernetes
常见网络
故障排查
这是今天在翻看《linux系统命令及shell脚本》一书中看到的,觉得挺受用的,特摘录下来。还想到之前在网络相关的一些命令,自己有简单的写过:查看网络是否正常,一般先确保以下设置是否正确1、网线是否连接正确2、ip地址和子网掩码是否设置正确(ifconfig)3、默认网关是否设置正确(route)4、域名服务器是否设置正确以下摘录内容:第一步是要确认网卡本身是否能正常工作?利用ping工具可以确认
慎思明辨
·
2020-06-29 21:56
网络
直播CDN架构内幕
直播整体介绍文章主要从直播CDN的业务介绍,CDN整体技术架构,
故障排查
,CDN系统质量评估来做介绍分析直播从技术架构上讲主要分以下三类:传统三层的CDN架构:1推流边缘—2推流区域—3源站----2拉流区域
思心
·
2020-06-29 21:11
nginx-rtmp
nginx-rtmp
服务器
故障排查
方法总结
服务器
故障排查
方法总结问题描述:每当出现网站访问不了的时候,估计应该就是服务器出现故障了,这个时候大部分情况都是属于数据库出现问题。
wjtlht928
·
2020-06-29 19:13
Linux
Nginx返回400 Bad Request
故障排查
系统环境服务端:K8s集群使用NginxIngressController,并且支持http2客户端:golangversion1.9.2,且使用http2故障现象Nginx偶发400BadRequest,绝大部分请求正常返回200故障排除步骤(1)故障复现使用golanghttp2client,每个请求post相同的数据,直到response400;查询nginx日志,response为400时
wheatcookie
·
2020-06-29 18:34
nginx
vsphere
故障排查
vsphere
故障排查
vsphere
故障排查
1vSphere排错思想1.1
故障排查
逻辑1.2常规故障分层2虚拟机的
故障排查
2.1快照问题修复2.1.1解决CID不匹配问题2.1.2vss导致snapshot
迷鹿milu
·
2020-06-29 17:46
10款常见MySQL高可用方案选型解读
主要负责UCloud云数据库udb的内核
故障排查
工作以及数据库新特性的研发工作。
阿里云_云栖社区
·
2020-06-29 17:28
Linux网络
故障排查
文章目录1、链路是否连通2、网卡和ip是否正常3、是否正确配置了网关4、测试DNS是否可用5、远程主机是否开放端口6、使用nmap工具检测端口开放情况7、网络慢排查:iftop1、链路是否连通目的:检查网卡与网络是否物理连通,网线是否插好且连接可用,很多时候不能立刻到机房确定物理连接#检查网卡与网络是否物理连通,网线是否插好且连接可用,很多时候不能立刻到机房确定物理连接[root@linux-no
hsw Come on
·
2020-06-29 17:13
linux
JAVA 线上
故障排查
全套路
作者:fredalxin线上故障主要会包括CPU、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top三连,然后依次jstack、jmap伺候,具体问题具体分析即可。CPU一般来讲我们首先会排查CPU方面的问题。CPU异常往往还是比较好定位的
从事Java
·
2020-06-29 16:46
Linux运维常见
故障排查
和处理的技巧汇总
作为Linux运维,工作中多多少少会遇见这样那样的问题或故障,从中总结经验,查找问题,汇总并分析故障的原因,这是一个Linux运维工程师良好的习惯。每一次技术的突破,都经历着苦闷,伴随着快乐,可我们还是执着的继续努力,从中也积累了更多的经验。下面汇总了可能出现的故障及解决方法,看看你是否遇到过?并对你有帮助?第一:常见问题解决集锦1.shell脚本不执行问题:某天研发同事找我说帮他看看他写的she
_微疼
·
2020-06-29 15:45
使用kubeadm方式部署集群时,Node节点一直处于NotReady状态、coredns处于pending状态的解决思路与
故障排查
在官方文档中https://kubernetes.io/zh/docs/setup/production-environment/tools/kubeadm/troubleshooting-kubeadm/存在以下说明:也就是说,造成coredns组件处于pending状态的主要原因是网络插件没有安装好。只有当网络插件安装后,coredns组件才会正常启用。这也就解释了为什么节点会一直处于NotR
Shawn-Li
·
2020-06-29 14:36
Kubernetes
故障排查
与优化深入:企业级NginxWeb服务优化
nginx性能优化nginx安全优化一、Nginx基本安全优化1.1调整参数隐藏Nginx软件版本号信息一般来说,软件的漏洞都和版本有关,这个很像汽车的缺陷,同一批次的要有问题就都有问题,别的批次可能就都是好的。因此,我们应尽量隐藏或消除Web服务对访问用户显示各类敏感信息(例如Web软件名称及版本号等信息),这样恶意的用户就很难猜到他攻击的服务器所用的是否有特定漏洞的软件,或者是否有对应漏洞的某
daisy_118
·
2020-06-29 08:07
运维 常见
故障排查
常见名词含义1、IP地址IP地址是个32位的2进制数,是个虚拟的地址,通常我们把IP地址的每8位翻译成一个10进制数,然后用“.”分隔开来,所以也称之为点分十进制表示法。比如说192.168.1.1、10.1.1.2等。IP地址分为A\B\C\D\E五类,同时也有公有地址跟私有地址的区分。这里只讨论公有与私有的区分。公有地址的含义是可以在INTERNET上传输的地址,反之不能在INTERNET上传
⁶⁶⁶俺有两猴⁶⁶⁶
·
2020-06-29 07:14
APM应用性能管理监控使用体验--appdynamics
本文主要包含以下4部分内容注册AppDynamicsSaas账号安装监控代理Agent监控效果简介使用AppDynamics进行
故障排查
注册AppDynamicsSaas账号AppDyn
凌襄公子
·
2020-06-29 03:36
AppDynamics
ELK-elasticsearch
故障排查
篇
前言在生产上使用了ELK+filebeat,filebeat负责收集日志,Logtash负责过滤日志并输出到Elasticsearch,Elasticsearch根据Logstash的输出做索引,Kibana负责调用Elasticsearch的API接口展示数据。架构ELK是部署在单独的一台服务器上,负责收集日志的客户端总共是16台。故障登录Kibana查看信息的时候出现以下信息,说明Elasti
陈嘟嘟
·
2020-06-28 22:44
日志
Linux启动
故障排查
和修复技巧
一个执着于技术的公众号我发现Linux系统在启动过程中会出现一些故障,导致系统无法正常启动,我在这里写了几个应对单用户模式、GRUB命令操作、Linux救援模式的故障修复案例帮助大家了解此类问题的解决方法。(一)单用户模式Linux系统提供了单用户模式(类似Windows安全模式),可以在最小环境中进行系统维护。在单用户模式(运行级别1)中,Linux引导进入根shell,网络被禁用,只有少数进程
开源Linux
·
2020-06-28 21:39
kubernetes
故障排查
pod
故障排查
调试pod的第一步是看一下这个pod的信息,用如下命令查看一下pod的当前状态和最近的事件:$kubectldescribepods${POD_NAM查看一下pod中的容器所处的状态。
韩先超
·
2020-06-28 21:44
一些好用的开源监控工具汇总
编辑|张婵一些好用且开源的监控工具监控系统是整个IT架构中的重中之重,小到
故障排查
、问题定位,大到业务预测、运营管理,都离不开监控系统,可以说一个稳定、健康的IT架构中必然会有一个可信赖的监控系统。
高效开发运维
·
2020-06-28 19:47
网络排查思路
然而在实际
故障排查
过程中,这种分层方法往往被忽略,导致
故障排查
效率降低。两种逐层排查方式OSI的层次结构为管理员分析和排查故障提供了非常好的组织方式。由于各层相对独立,按层排查能够有
weixin_34292402
·
2020-06-28 16:35
linux运维系统
故障排查
思路及常见故障处理
一linux系统故障的一般处理思路报错信息--->查阅日志文件--->分析定位问题--->解决问题。二linux系统无法启动原因及解决系统无法启动的原因很多,常见的有下面几种情况:1文件系统被破坏,常常因断电和非法关机引起文件系统结构不一致。修复方法是用fsck命名强制修复,进入单用户模式或者交互界面,按提示进入修改模式中,卸载对应的问题磁盘,然后用fsck命令修复,无法恢复的数据会存放在lost
weixin_34279184
·
2020-06-28 15:41
TCP/IP数据包结构具体解释
如:网络监控,
故障排查
等……IP包是不安全的,可是它是互联网的基础,在各方面都有广泛的应用。由IP协议衍生的协议族有10数种(据我所知),以后还会出现很多其它的基于IP的协议…先从实际出发吧!
weixin_34199405
·
2020-06-28 13:52
51CTO学习笔记--Linux运维
故障排查
思路与系统调优技巧视频课程(高俊峰)
51CTO学习笔记--Linux运维
故障排查
思路与系统调优技巧视频课程第一课Linux运维经验分享与思路1、一般把主机名,写到hosts下127.0.0.1hostname,因为很多应用要解析到本地。
weixin_34191734
·
2020-06-28 13:28
服务器硬件
故障排查
电源故障现象1、接电源线、电源灯不亮2、电源指示灯报警3、电源灯正常、按开机键无反应排查方式:1、检测电源线的接触是否有松散2、替换电源测试3、供电环境检测(是否存在电压不稳定)4、查看事件日志主板故障现象:1、按开机键无效,黑屏2、设备启动正常,接显示器黑屏3、设备某些接口或者插槽接配件,导致无法开机CPU故障现象1、按开机键无效,黑屏2、设备自动重启3、设备无辜宕机排查方式:1、检测CPU安装
weixin_34161083
·
2020-06-28 12:24
k8s部署使用Dashboard(十)--技术流ken
为了提供更丰富的用户体验,Kubernetes还开发了一个基于Web的Dashboard,用户可以用KubernetesDashboard部署容器化的应用、监控应用的状态、执行
故障排查
任务以及管理Kubernetes
weixin_34144450
·
2020-06-28 12:59
坑爹坑娘坑祖宗的87端口(记一次tomcat
故障排查
)
问题来源因为经常有各种各样的大小项目要跑,全部放一个tomcat很慢,所以俺平时喜欢新建80-89这10个tomcat,分别放不同的项目。以前还一直用的好好的,昨天突然发现87端口的tomcat怎么都访问不了,本来大不了换一个别的端口就了事,但是我觉得问题既然碰到了就要彻底排查,不然下次再碰到就又没辙了。这个奇怪的问题纠结了我将近一天左右,记录下来是为了让后来人少走坑爹路。如果你想直接知道原因而不
weixin_34101784
·
2020-06-28 11:46
小型公司局域网
故障排查
(思科)
一、根据实验需求排除故障确保PC1与PC2互通排查思路:1.首先确保PC机IP地址及子网掩码是否正确;网线是否有问题;2.查看链接PC的交换机信息及端口链路状态,端口确保是开启状态;3.依次查看交换机内部信息配置是否正确;进行修改;4.查看命令如下:showvlanbi①PC1子网掩码错误,是24位;修改成27位,和PC2一致②确保交换机SW1创建VLAN10;端口1和端口23配置正确如下:有多余
weixin_34007886
·
2020-06-28 09:34
网络
故障排查
常用命令集
查询路由表(route)route命令可以显示你当前的路由表信息,包括你的默认网关。$sudoroute-nKernelIProutingtableDestinationGatewayGenmaskFlagsMetricRefUseIface10.1.1.0*255.255.255.0U000eth0default10.1.1.10.0.0.0UG10000eth0我们需要重点关注的是最后一行,即
weixin_34004750
·
2020-06-28 09:33
Kylin 设置邮件报警、用户管理和自定义数据源切换
因此,当一个Cube构建任务完成或失败时,运维人员常常希望可以在第一时间得到通知,以便进行下一步的增量构建或
故障排查
。
weixin_33971977
·
2020-06-28 09:42
《高性能Linux服务器构建实战》笔记
系统安全、
故障排查
、自动化运维、集群架构1、账号安全,安装完后可以删除的账号:adm,lp,sync,shutdown,halt,news,uucp,operator,games,gopher禁用登录功能
weixin_33881050
·
2020-06-28 07:36
linux学习,网络
故障排查
.当linux操作系统产生网络故障时,应先从硬件到软件/,1,检查网线、网卡。到机房里检查网线两端是否都亮灯,普通服务器的话应该是绿灯常亮为正常,交换机绿灯闪烁表示正在传输数据。也可以通过命令ifconfigeth0/ethtooleth0来查看某一网卡的链路是否物理连通。2.确定网线是通的之后,再看物理网卡。ifconfig可以看到已成功加载的网卡,用ethtool-iethX可以看到网卡驱动。
weixin_33827965
·
2020-06-28 06:17
网络及服务
故障排查
pingwww.baidu.com如果ping不通icmp协议可能被禁止了(高速公路有没有修通),linux禁止icmp协议。ping-c2-i2-s512www.baidu.com2.traceroutewww.baidu.com基础检查,(各个高速节点有没有修通,跟踪路由)[root@oldboylinux~]#traceroute-nwww.baidu.comtraceroutetowww.
weixin_33800463
·
2020-06-28 05:28
《高性能Linux服务器构建实战:系统安全、
故障排查
、自动化运维与集群架构》——第3章 数据安全工具DRBD、extundelete 3.1 数据镜像软件DRBD介绍...
本节书摘来自华章计算机《高性能Linux服务器构建实战:系统安全、
故障排查
、自动化运维与集群架构》一书中的第3章,第3.1节,作者:高俊峰著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
weixin_33753845
·
2020-06-28 04:09
电脑开机后卡死,桌面图标点了没反应怎么办
经过信息收集和
故障排查
,判定位系统启动项问题,
weixin_33720956
·
2020-06-28 03:09
手机如何进行路由追踪?
路由追踪为网络
故障排查
常用手段,用于检测故障点的位置所在。电脑进行路由追踪命令为tracert【ip】手机不能直接使用命令。需要下载对应软件。
weixin_30908103
·
2020-06-28 02:05
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他