E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
故障转移群集故障排查
Exchange
故障转移群集
网络阀值调优
概述WindowsServer故障转移集群是一个高可用性平台,它不断监视集群中的网络连接和节点的健康状况。如果一个节点无法通过网络访问,那么将采取恢复操作来恢复集群中的另一个节点上的应用程序和服务,并使其联机。缺省情况下,故障转移集群被配置为提供最高级别的可用性,停机时间最小。默认的开箱即用设置是针对服务器完全丢失的故障进行优化的,我们将在本博客中称之为硬故障。这些将是不可恢复的故障场景,例如非冗
CaiJiantao
·
2019-03-12 09:44
exchange群及故障转移
修改exchange群集心跳
修改心跳延迟和阀值
Exchange
故障排查
——CPU使用率过高
本篇将介绍CPU使用率过高的处理方案。CPU使用率CPU使用率过高,跟内存和进程都有关系,例如复杂运算,一般都会导致CPU升高。使用top命令查看(按1可以查看多核的CPU使用情况):产生原因第三行CPU占用率根据类型有以下几种情况:(us)user:CPU在低nice值(高优先级)用户态所占用的时间(nice0)。默认新启动的进程nice=0,是不会计入这里的,除非手动通过renice或者set
mUncleWang
·
2019-03-10 12:08
Linux
监控和故障
Windows Server中的
故障转移群集
的实现机制
Windows服务器故障转移集群(WindowsServerFailoverCluster,简称WSFC)使用仲裁投票(QuorumVoting)决定集群的健康状况,或使故障自动转移,或使集群离线。当集群中的节点发生故障时,会由其他节点接手继续提供服务,不过,当节点之间通信出现问题,或大多数节点发生故障时,集群就会停止服务。可是集群可以容忍多少个结点发生故障呢?这要由仲裁配置(QuorumConf
CaiJiantao
·
2019-03-09 11:13
cluster
failover
故障转移群集
群集
Windows
Server
故障排查
——负载Load过高
本篇将介绍负载过高的处理方案。负载在Linux系统中,uptime、w、top等命令都会有系统平均负载loadaverage的输出:产生原因负载受到多个因素影响,带宽、系统硬件配置、内核参数、应用程序等。排查步骤在查看了top命令所显示的状态后,需要依据其来做优化,但top命令显示的只是表象,所以我们可以通过iostat或者vmstat命令进一步的观察。查看系统负载procsr列表示运行和等待cp
mUncleWang
·
2019-03-07 23:20
Linux
监控和故障
Linux Centos6.9常用基础命令
过十分钟后重启shutdown-r20:35#20:35分重启关机命令:halt#立刻关机poweroff#立刻关机shutdown-hnow#立刻关机(root用户使用)shutdown-h10#十分钟后关机
故障排查
王·先生
·
2019-03-07 15:49
Linux
Centos6.9基础学习之路
记一次Nagios服务启动失败的
故障排查
故障场景:一台装有Nagios服务的CentOS重启后,Nagios服务启动失败,报错信息是没有这个目录cfg_dir=/etc/nagios/conf.d排障过程:1、我一看“嘿,谁改这一句,配置文件目录应该是objects吧”想当然地将这个参数改成了cfg_dir=/etc/nagios/objects再次启动,还是报错!看提示是说notify-host-by-email这个值重复了。2、运行
辉晖飛
·
2019-03-07 14:55
Nagios
故障
更新
Linux
记一次线上DPDK-LVS的
故障排查
背景我们内部基于dpdk自研的高性能负载均衡器dpvs已经在多个机房部署上线,运行正常,但近期有多个金融相关的业务反馈,服务数据包在经过dpvs转发后,会出现hang住的情况。问题dpvs已经在多个机房上线,运行时间已超过半年,为何突然有业务反馈异常反馈问题的业务多与金融区相关(金融区由于其特殊性,会额外增加安全方面的加固策略)为什么问题表现均为服务hang住问题排查首先,我们怀疑与dpvs或与金
twohearts0
·
2019-03-07 10:17
DPDK
LVS
故障
配电房维保助学校避免配电柜故障
配电房在运行过程中出现小事故在所难免,只需要通过配电房维保来对
故障排查
修复即可。在配电房中,配电柜事故发生几率是比较高的,而为了应对事故发生这种突发情况,需要对其进行排查修复。
游倪君
·
2019-02-28 11:23
故障排查
-linux命令测试端口连通性
方法一:telnet法预置条件:安装telnetstep1、rpm-qatelnet-server(无输出表示telnet-server未安装,则执行step2;否则执行step3)step2、yum-yinstalltelnet-server(安装telnet-server)step3、rpm-qatelnet(无输出表示telnet未安装,则执行step4,否则执行step5)step4、yu
luvsic
·
2019-02-17 19:35
如何在Azure中配置SQL Server 2008 R2
故障转移群集
实例
配置Azure实例我不会在这里详细介绍一些屏幕截图,特别是因为Azure门户UI经常会经常更改,所以我拍摄的任何屏幕截图都会很快变得陈旧。相反,我将只介绍您应该了解的重要主题。故障域或可用区?为了确保您的SQLServer实例具有高可用性,您必须确保您的群集节点位于不同的故障域(FD)或不同的可用区(AZ)中。您的实例不仅需要驻留在不同的FD或AZ中,而且您的文件共享见证(见下文)也需要驻留在与您
Tybyqi
·
2019-02-13 15:37
编程语言
Skype for Business Online 中给个别用户拨号通话时出现故障
一般情况下,我们都会先通过日志进行
故障排查
。如果是本地部署的SFB环境,由于IT暂时拿不到客户端信息,就需要先从服务器端查看。
ljb_job
·
2019-02-01 10:58
SFB
Online
Office
365
网络
故障排查
常见方法
网络故障的诊断在故障不明的情况下,应先诊断硬件故障,后诊断软件故障;在突发网络故障时,合理是首先查看本机网络硬件是否工作正常。常见排障命令telnet:确认目标应用端口是否有监听。ping:确认源地址到目的地址之间是否可达。tracert:跟踪源地址到目的地址中间经过的所有路由器。常用排障步骤网络故障一般表现为某个应用没法访问。基本思路是先排除应用本身的问题,然后定位网络故障点。一般排障步骤如下:
张嘉木
·
2019-01-10 15:31
运维
网络
MySQL DeadLock
故障排查
全过程记录
【作者】刘博:携程技术保障中心数据库高级经理,主要关注Sqlserver和Mysql的运维和故障处理。【环境】版本号:5.6.21隔离级别:REPEATABLEREAD【问题描述】接到监控报警,有一个线上的应用DeadLock报错,每15分钟会准时出现,报错统计如下图:登录Mysql服务器查看日志:mysql>showengineinnodbstatus\G***(1)TRANSACTION:TR
携程DBA
·
2019-01-03 10:22
kubernetes部署dashboard可视化插件
用户可以用KubernetesDashboard部署容器化的应用、监控应用的状态、执行
故障排查
任务以及管理Kubernetes各种资源。
willblog
·
2019-01-02 12:37
kubernetes
MySQL DeadLock
故障排查
过程
【作者】刘博:携程技术保障中心数据库高级经理,主要关注Sqlserver和Mysql的运维和故障处理。【环境】版本号:5.6.21隔离级别:REPEATABLEREAD【问题描述】接到监控报警,有一个线上的应用DeadLock报错,每15分钟会准时出现,报错统计如下图:登录Mysql服务器查看日志:mysql>showengineinnodbstatus\G***(1)TRANSACTION:TR
携程DBA
·
2019-01-02 11:00
Oracle 11g监听的
故障排查
虚机数据库服务器oracle11G的监听意外中止,报错如下在虚机上执行lsnrctlstart,问题解决。1、当连接异常时,可以通过分析监听日志来查找线索〜[test]$find$ORACLE_HOME-namelistener.log/opt/64bit/oracle/11.2.0/log/diag/tnslsnr/sinrndvud062/listener/trace/listener.log
xjsunjie
·
2018-12-27 16:18
监听
排查
数据库与大数据
Kubernetes 使用 Weave Scope 监控集群(十七)
Kubernetes是一个复杂系统,运维团队需要有一套工具帮助他们获知集群的实时状态,并为
故障排查
提供及时和准确的数据支持。
wzlinux
·
2018-12-23 11:58
kubernetes
使用
Kubernetes
由一个文件下载卡住引起的
故障排查
过程
故障现象:现场反馈,一个导出zip压缩包的下载功能,卡住847M不动了,滚动条不断提示,但速度为0,用的chrome浏览器。经,询问,另一个导出100多M的文件正常。排查过程:首先在家里进行了测试,模拟了1G的文件进行测试,一切正常。又模拟了2G的文件,显示内存溢出。但是传送文件是通过流传输的,通过apache的IOUtils.copy复制到HttpResponse的OutPutStream,不会
rumeng_you
·
2018-12-20 13:44
springboot
logback
accesslog
Kubernetes 配置管理 Dashboard(十三)
为了提供更丰富的用户体验,Kubernetes还开发了一个基于Web的Dashboard,用户可以用KubernetesDashboard部署容器化的应用、监控应用的状态、执行
故障排查
任务以及管理Kubernetes
wzlinux
·
2018-12-17 18:45
kubernetes
k8s
dashboard
Kubernetes
一次无线网络
故障排查
用户发来邮件说XX楼4楼无线断网,用户能连上无线,可是不能上网,部分用户能上网不过也不太稳定。由于休假,不能出现场,只能远程连上去看看到底发生了什么。以下是故障排除过程,仅供参考:1、telnet到AP连接的交换机上,通过showlogg查看系统日志,发现有5个连接AP的接口出现up、down的现象,并且现象反复。使用showmacaddress命令查看通过上图可以看到五个接口对应的AP的MAC地
弯月楼主
·
2018-12-17 11:11
无线
上网故障
断网
无线技术
网络
故障排查
1、网络配置ip、gateway、DNS、NetMask2、物理连接检查网络接口或者网线连接是否正常3、pingIP和DNS看看是否能ping通一般DNS可以是:8.8.8.8、114.114.114.114、172.168.54.1604、nslookup寻找DNS解析域名5、tracert/tracert-d寻找网络跳跃节点6、反向trace跟踪跳跃,看看网络在哪断的7、telnet检查对方哪
写出你我
·
2018-12-14 16:11
Tomcat服务
故障排查
:打开文件过多
现象lsof-p进程号后出现一堆sock类型的文件。超过了ulimit的限定值。导致一些请求处理失败。java26851jboss5*165usock0,70t0207976628protocol:TCPv6java26851jboss5*166usock0,70t0207967655protocol:TCPv6java26851jboss5*167usock0,70t0207965389prot
define_us
·
2018-12-11 10:51
故障排查
Windows系统
故障排查
服务器无法远程连接常见原因和解决方式:1、系统问题:卡死、蓝屏、系统文件丢失导致系统损坏等。解决办法:系统卡死时,硬重启下系统。蓝屏查看对应出现代码看下是什么问题导致的系统文件丢失,先排查下是那个文件丢失,然后尝试修复,修复不了就格式化系统盘重装系统2、系统内安装安全类软件(安全狗等软件)后,未开放相应的协议及端口而被拦截。解决办法:在安全软件中放行对应的端口,或者暂时关闭退出安全软件3、修改了远
Zhiwei_
·
2018-12-10 19:14
无法远程
故障排查
mongodb 监控工具 mongo-monitor 安装部署
相关介绍如下:mongo-monitorCLI是一个简洁和简单的工具来检查MongoDB的服务,在集群调试升级期间,
故障排查
,添加节点,调整分片、修改配置等操作时可以实时查看整个集群状态,全方位了解集群状态
无锋剑
·
2018-12-04 17:37
mongo
mongodb
cluster
Redis
Mongodb
电脑开机后卡死,桌面图标点了没反应怎么办
经过信息收集和
故障排查
,判定位系统启动项问题,
coldsama
·
2018-12-04 15:00
开机卡死
桌面卡死
网络
故障解决
Skype for Business后端数据库Alwayson
在做Skypeforbusinessserver项目规划的时候涉及到企业版后端数据库高可用的问题,微软官方支持三种默认:1、SQL
故障转移群集
2、SQL镜像3、SQLAlwaysonSQL
故障转移群集
是比
scnbwy
·
2018-12-04 12:18
sfb
alwayson
Skype
Server
内存
故障排查
本节介绍常见内存故障的排查与定位。以下先对内存中常见的内存相关错误进行分析。内存相关的错误,按错误来源可划分为以几类:内存泄漏内存泄漏是指系统中没有引用的“孤儿”内存对象。持续的内存泄漏会表现为系统内存不断减少,而偶发的少量泄漏则可能难以觉察,并不会有破坏性后果错误的内存使用方式应用程序未按预期使用内存,占用了大量内存以致于影响到系统的正常运行。这类错误可归结设计时内存分析不到位所致。例如,分片的
痞子锐
·
2018-11-24 15:13
网络随笔
内存
故障排查
本节介绍常见内存故障的排查与定位。以下先对内存中常见的内存相关错误进行分析。内存相关的错误,按错误来源可划分为以几类:内存泄漏内存泄漏是指系统中没有引用的“孤儿”内存对象。持续的内存泄漏会表现为系统内存不断减少,而偶发的少量泄漏则可能难以觉察,并不会有破坏性后果错误的内存使用方式应用程序未按预期使用内存,占用了大量内存以致于影响到系统的正常运行。这类错误可归结设计时内存分析不到位所致。例如,分片的
痞子锐
·
2018-11-24 15:13
网络随笔
DL4J中文文档/调优与训练/
故障排查
神经网络训练的
故障排查
神经网络很难调优。如果网络超参数选择不当,网络学习可能会慢,或者根本不学习。本页旨在提供在调优网络时应采取的一些基准步骤。这些技巧中的许多已经在学术文献中讨论过。
bewithme
·
2018-11-18 16:25
AI
防止系统宕机?给你推荐六个开源监控工具
监控系统是整个IT架构中的重中之重,小到
故障排查
、问题定位,大到业务预测、运营管理,都离不开监控系统,
MacTalk
·
2018-11-16 00:00
性能测试之内存异常-JVM内存
故障排查
方法
今天和你一起学习JVM内存的
故障排查
方法。NativeMemoryTracking是什么NativeMemoryTracking(NMT)是JavaHotspotVM的一个功能。
疯狂的程序员丶
·
2018-11-14 17:55
软件测试
JVM命令-java服务器
故障排查
一、top(Linux命令)执行top命令:(查看进程15477的详细情况,下文用到)系统信息(前五行):第1行:Top任务队列信息(系统运行状态及平均负载),与uptime命令结果相同。第1段:系统当前时间,例如:16:07:37第2段:系统运行时间,未重启的时间,时间越长系统越稳定。格式:upxxdays,HH:MM例如:241days,20:11,表示连续运行了241天20小时11分钟第3段
java菜
·
2018-11-04 15:07
【整合】【
故障排查
】LINUX系统资源使用情况排查(top、htop、ps、pstree)
LINUX系统资源使用情况排查工作中我们常见的资源使用情况的排查包括,CPU使用情况、内存使用情况、网络带宽使用情况等等。而我们常用的工具有top、htop、ps、pstree等等,htop--top加强版,pstree—ps加强版.ps与top的却别与使用命令,参考:https://blog.csdn.net/timchen525/article/details/76364706更多linux命
GeeLoong
·
2018-10-28 02:09
Linux
运维测试
「Mongo」Unauthorized
故障排查
手记
故障现象服务端的架构是Vue.js+Express+MongoDB来读取爬虫的数据,出现接口请求不到数据的情况,Express返回的错误信息如下{"status":"1","msg":"Topologywasdestroyed"}不是Express的问题,而是Mongo数据库挂了,重启后第二天依然宕机。查看Mongo日志可以看到不同的授权命令错误。getLog:"startupWarnings"&
HughDong
·
2018-10-23 11:05
【Linux】远程连接Linux系统及
故障排查
参考资料:1.视频课程《Linux运维》2.书籍PDF版《Linux运维Web集群实战》远程连接Linux系统原理互联网上的计算机都会有一个32位的地址,ip地址。我们访问服务器,就必须通过这个ip地址。局域网里也有预留的ip地址192/10/172开头。局域网的ip地址也是唯一的。NAT模式,电脑宿主机的ip在局域网里一定唯一,NAT模式创建虚拟机,虚拟机就是一个新的局域网(私有网络)。老师的机
胖佳儿Clara
·
2018-10-21 01:49
Linux
HBase GC
故障排查
现象那是系统阳光明媚的一天。HBase在日常进行自己的minorgc,清理自己的新生代。2018-10-09T09:00:56.550+0800:351217.975:[GC(AllocationFailure)2018-10-09T09:00:56.550+0800:351217.975:[ParNew:2830029K->137329K(3015488K),0.0346337secs]9518
define_us
·
2018-10-11 13:42
java
数据分析岗位职责
给出分析结果;3、具有丰富的数据分析、挖掘、数据仓库建模的项目实践经验,擅长常用的统计方法如:线性回归、逻辑回归、实验设计、市场分析、聚类、分群等;4、参与并审核数据库设计,纠正已有的不合理的db设计;5、
故障排查
Alien_lily
·
2018-10-09 16:11
岗位面试
Kubernetes之kubectl常用命令:
故障排查
和故障解决
kubectl
故障排查
相关常用命令编号命令说明1version显示客户端和服务器侧版本信息2api-versions以group/version的格式显示服务器侧所支持的API版本3explain显示资源文档信息
菲宇
·
2018-09-20 21:44
Kubernetes
昊鼎王五:蓝鲸智云--0.1.1.安装指南
本文档主要介绍蓝鲸社区版的初次安装部署、日常维护、更新升级、
故障排查
等运维相关的内容。关于蓝鲸各大平台、SaaS应用的相关使用说明,请参考蓝鲸社区版产品白皮书。#安装方案概述蓝鲸社区版安装介质分
昊鼎王五
·
2018-09-17 18:44
蓝鲸智云
Office365 Exchange Hybrid 番外篇 ADFS后端SQLAlwayson(二)
如何来配置alwayson两台SQLServer服务器上安装好SQL后,任意打开一台SQL服务管理器,选择SQLServer(MSSQLSERVER)属性-选择alwayson高可用性,填写上Windows
故障转移群集
的
scnbwy
·
2018-09-16 21:23
SQL
alway
son
Office
365
Office365 Exchange Hybrid 番外篇 ADFS后端SQLAlwayson(一)
前面几篇文章跟大家分享了SQL
故障转移群集
的实施部署过程,ADFS的后端数据库SQL的高可用可以是群集可以是镜像也可以是alwayson,当然这个是针对SQL数据库来做高可用,不局限于使用在ADFS上任何使用
scnbwy
·
2018-09-16 21:02
SQL
Alway
son
Office
365
Office365 Exchange Hybrid 番外篇 ADFS后端SQL群集(三)
上一篇文章基本把SQL
故障转移群集
的相关前置条件完成,接下来这篇文章跟大家分享一下如何实施Windows
故障转移群集
(SQL群集的基础)我们需要在SQL01和SQL02两个节点服务器上安装多路径I\O和故障转移的功能安装完成后
scnbwy
·
2018-09-14 20:33
SQL
群集
Office
365
Office365 Exchange Hybrid 番外篇 ADFS后端SQL群集(一)
SQL的群集是基于windows
故障转移群集
的且需要共享存储空间。用网络上的图来一段SQL群集的自我解说Instance是SQL实例,两台服务器
scnbwy
·
2018-09-14 18:59
SQL
群集
Office
365
DAG知识点简述
DAG最多由16个邮箱服务器组成的组,它们使用Windows
故障转移群集
和连续复制的组件来为邮箱数据库提供高可用性解决方案。
烟台山下
·
2018-09-14 17:28
exchange
DAG
DAG
EXCHANGE-2013
线上
故障排查
(1) - Java应用故障之高CPU占用的问题及排查方案
做为应用负责人,谁都希望自己负责的应用能够在线上跑得顺顺当当,不出任何错误,也不产生任何告警,当然这是最理想的结果,也是做为技术人员希望达到的最终效果。可是实事上应用就像小孩一样,总会在不经意间,不按你期望的结果运行,如CPU偏高、内存占用偏高、应用没有响应、应用自动挂掉等,搞得我们技术人员不是一般的头大。我本人虽然身处管理岗位,也是处理在技术的第一线,也曾碰到过各种各样的奇奇怪怪的问题,在此记录
冯立彬
·
2018-09-13 17:32
JAVA实用笔记
CPU偏高
jstack
ps
java应用故障
【ceph
故障排查
】ceph集群添加了一个osd之后,该osd的状态始终为down
背景ceph集群添加了一个osd之后,该osd的状态始终为down。错误提示状态查看如下1、查看osdtree[root@node1Asia]#cephosdtreeIDWEIGHTTYPENAMEUP/DOWNREWEIGHTPRIMARY-AFFINITY-10.05388rootdefault-20.01469hostnode100.00490osd.0up1.000001.0000010.
运维少年
·
2018-09-10 15:12
ceph
Linux运维
kube-proxy的ipvs模式解读
IPVS和IPTABLES区别如何设置kube-proxy按照ipvs模式运行和
故障排查
什么是IPVSIPVS(IP虚拟服务器)实现传输层负载平衡,通常称为第4层LAN交换,是Linux内核的一部分。
iyacontrol
·
2018-09-10 00:00
ipvsadm
k8s
kubernetes
MPLS 专网中的疑难
故障排查
(一)
课题内容:由于eBGP接口掩码配置错误,导致的路由拒绝接收知识点:BGP第三方下一跳、BGP路由更新根据现有网络技术学习及参考材料,BGP对等体之间建立对等关系,传递路由更新,并未有检查对等体掩码的行为。本文将结合实际案例为大家分享一个MPLS专网中由于一个子网掩码配置错误导致的eBGP对等体拒绝接收路由更新的场景。网络拓扑:借着研究课题,复习一下MPLS专网的基本部署练习;部署VRF:R1、R4
达叔michael
·
2018-09-06 17:15
思科认证
MPLS故障排查
CCIE培训
MPLS及MPLS专网专题
光缆
故障排查
处理
一、故障背景某公司网络主管反映,该公司的两栋办公楼之间的光缆存在线路故障,无法实现网络互通,相关业务无法正常使用。经过对故障线路的的资料调查获取,我们得知,由于前期修路施工将该线缆破坏,然后维修人员对光缆进行重新熔接,在此过程中,可能导致光缆中的个别芯存在错位等问题,由此引发后续故障问题。基于如上信息,我们开始对故障进行判断与排查。二、故障分析、解决第1步:现场排查首先,在A楼的网络机房找到与B楼
coldsama
·
2018-08-24 11:06
光缆故障
光功率计
光纤修复
故障解决
Tensorflow内存溢出问题
本文在实现Tensorflow模型的保存(save)和重新调用(restore)过程中,程序总是发生内存溢出而中止的问题,所以对其进行
故障排查
。
惊鸿指尖
·
2018-08-19 13:45
上一页
22
23
24
25
26
27
28
29
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他