E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
网络丢包故障分析
服务端监控方案
辅助线上故障定位、
故障分析
运维支持:我们系统能够有数据支撑我们进行容量规划、报警和扩容,等。自动化运维:比如自动扩
linlzk
·
2015-08-11 17:00
apm
SERVER监控
Hadoop集群硬盘
故障分析
与自动化修复
作者:Zhang,Haohao摘要:硬盘在服务器中起着至关重要的作用,因为硬盘里面存储的是数据,随着制造业技术的提高,硬盘的类型也在逐渐的改变。对于硬盘的管理是IAAS部门的责任,但作为业务运维也需要懂得相关的技术。有的公司采用LVM来管理硬盘,这样做方便扩缩容,也有的公司直接用裸盘来存数据,这样做的好处是不会因LVM而损失掉一部分硬盘I/O速度。需要根据不同的场景采用不同的方式来管理。Hadoo
·
2015-08-11 15:00
hadoop
Hadoop集群硬盘
故障分析
与自动化修复
作者:Zhang,Haohao摘要:硬盘在服务器中起着至关重要的作用,因为硬盘里面存储的是数据,随着制造业技术的提高,硬盘的类型也在逐渐的改变。对于硬盘的管理是IAAS部门的责任,但作为业务运维也需要懂得相关的技术。有的公司采用LVM来管理硬盘,这样做方便扩缩容,也有的公司直接用裸盘来存数据,这样做的好处是不会因LVM而损失掉一部分硬盘I/O速度。需要根据不同的场景采用不同的方式来管理。Hadoo
ebay
·
2015-08-11 15:00
hadoop
集群
硬盘
《机器学习实战》之K-均值聚类算法的python实现
《机器学习实战》之K-均值聚类算法的python实现最近的项目是关于“基于数据挖掘的电路
故障分析
”,项目基本上都是师兄们在做,我只是在研究关于项目中用到的如下几种算法:二分均值聚类、最近邻分类、基于规则的分类器以及支持向量机
u010412719
·
2015-07-28 20:00
python
机器学习实战
K-均值聚类算法
Hadoop集群硬盘
故障分析
与自动化修复
Hadoop集群硬盘
故障分析
与自动化修复摘要:硬盘在服务器中起着至关重要的作用,因为硬盘里面存储的是数据,随着制造业技术的提高,硬盘的类型也在逐渐的改变。
zhouxing_good
·
2015-07-15 17:43
linux
硬盘
tune2fs
fdisk
mkfs
parted
Hadoop集群硬盘
故障分析
与自动化修复
Hadoop集群硬盘
故障分析
与自动化修复摘要:硬盘在服务器中起着至关重要的作用,因为硬盘里面存储的是数据,随着制造业技术的提高,硬盘的类型也在逐渐的改变。
zhouxing_good
·
2015-07-15 17:43
linux
硬盘
tune2fs
mkfs
fdisk
parted
Hadoop集群硬盘
故障分析
与自动化修复
Hadoop集群硬盘
故障分析
与自动化修复摘要:硬盘在服务器中起着至关重要的作用,因为硬盘里面存储的是数据,随着制造业技术的提高,硬盘的类型也在逐渐的改变。
aaabbbbttt
·
2015-07-15 17:43
linux
硬盘
fdisk
parte
Linux
Hadoop集群硬盘
故障分析
与自动化修复
摘要硬盘在服务器中起着至关重要的作用,因为硬盘里面存储的是数据,随着制造业技术的提高,硬盘的类型也在逐渐的改变。对于硬盘的管理是IAAS部门的责任,但作为业务运维也需要懂得相关的技术。有的公司采用LVM来管理硬盘,这样做方便扩缩容,也有的公司直接用裸盘来存数据,这样做的好处是不会因LVM而损失掉一部分硬盘I/O速度。需要根据不同的场景采用不同的方式来管理。Hadoop集群中跑Datanode服务的
you can make it
·
2015-07-15 17:43
DevOps
同时大量PPPoE连接请求,攻击PPPoE服务器,导致的用户异常掉线
故障分析
前几天接一个客户电话,PPPoE下用户异常掉线,掉线后拨号困难 到达后,我首先查看PPPoE日志,发现一秒钟内有大量PADI包,浪费服务器的SESSION,同时让服务器无法处理其他用户的请求。 打开Wireshark后,发现用户使用协靠的MAC地址,就是自定义数据包,来发送数据 这种大量的PPPoE请求,严重浪费了PPPoE SERVER的资源,导致服务器没有办法正常接受用户的心跳包,导致掉
·
2015-07-15 10:00
服务器
Linux:安装双系统(Win7+Ubuntu)后,Ubuntu正常,Win7无法启动,有需要的朋友可以参考下
故障分析
:安装Ubuntu的过程中经历分区步骤,如下图。在指定BootLoader时并未选择默认的选项/dev/
小贝壳
·
2015-07-14 22:09
Linux:安装双系统(Win7+Ubuntu)后,Ubuntu正常,Win7无法启动,有需要的朋友可以参考下
故障分析
:安装Ubuntu的过程中经历分区步骤,如下图。在指定BootLoader时并未选择默认的选项/dev
guyuan1983
·
2015-07-14 22:00
Linux的网络监控工具Smokeping
Smokeping底层是用rrdtool做支持,特点是画图漂亮,
网络丢包
和延迟用颜色和阴影来表示。
网络接口
·
2015-07-12 23:00
linux
exchange 2010 server内网邮箱突然不能收发外网邮件的问题分析解决办法
故障分析
:分析最近对服务器做了那些操作。
wangbing83
·
2015-07-03 16:45
server
服务器
Exchange
邮箱
收发邮件
exchange 2010 server内网邮箱突然不能收发外网邮件的问题分析解决办法
故障分析
:分析最近对服务器做了那些操作。
wangbing83
·
2015-07-03 16:45
server
服务器
Exchange
邮箱
收发邮件
Tip:outlook无法通过CAS服务器更新脱机通讯薄
=======================================================
故障分析
通过运行客户端autodiscover自动发现,可以找到OAB的虚拟目录地址https
zengchuixin2008
·
2015-06-21 21:01
server
Exchange
OAB
排错管理
Tip:outlook无法通过CAS服务器更新脱机通讯薄
=======================================================
故障分析
通过运行客户端autodiscover自动发现,可以找到OAB的虚拟目录地址https
zengchuixin2008
·
2015-06-21 21:01
OAB
exchange
server
排错管理
Exchange
Server
Tip:outlook无法通过CAS服务器更新脱机通讯薄
=======================================================
故障分析
通过运行客户端autodiscover自动发现,可以找到OAB的虚拟目录地址https
zengchuixin2008
·
2015-06-21 21:01
server
Exchange
OAB
排错管理
如何快速定位云主机的故障
作为一名从事Linux运维行业多年的运维人员,分享一下曾经在运维过程中遇到过的荆手的
故障分析
,供大家分享,如果你在使用云计算中有什么问题,可以根据以下方式来查找 遇到服务器故障,问题出现的原因很少可以一下就想到
mac_zhao
·
2015-06-19 09:00
Oracle
故障分析
ORA-01089
今天对测试库发出shutdownimmediate命令后观察日志发现如下内容:TueMay1209:52:452015SHUTDOWN:Activeprocessespreventshutdownoperation shutdown被活动的进程阻止了,Ctrl+C无法中断当前回话,退出重连服务器,打开新的会话:[oracle@021Y-SH-BKAP ~]$ sqlplus / as sysdb
onlinekof2001
·
2015-05-12 10:02
oracle
报错
故障分析
Oracle
故障分析
ORA-01089
今天对测试库发出shutdownimmediate命令后观察日志发现如下内容:TueMay1209:52:452015SHUTDOWN:Activeprocessespreventshutdownoperationshutdown被活动的进程阻止了,Ctrl+C无法中断当前回话,退出重连服务器,打开新的会话:[oracle@021Y-SH-BKAP ~]$ sqlplus / as sysdba
onlinekof2001
·
2015-05-12 10:02
oracle
报错
故障分析
Oracle故障处理
Mongos进程出现OOM
10.4.4.66是mongos的IP地址二
故障分析
1.查看mongos进程是
自由linux
·
2015-04-23 18:56
oom
进程
mongos
Mongos进程出现OOM
10.4.4.66是mongos的IP地址二
故障分析
1.查看mongos进程是
自由linux
·
2015-04-23 18:56
oom
进程
mongos
Mongos进程出现OOM
10.4.4.66是mongos的IP地址二
故障分析
1.查看mongos进程是
自由linux
·
2015-04-23 18:56
进程
OOM
mongos
故障处理
Hadoop运维记录系列(十四)
周末去了趟外地,受托给某省移动公司(经确认更正,是中国移动位置基地,不是省公司)做了一下Hadoop集群
故障分析
和性能调优,把一些问题点记录下来。
Slaytanic
·
2015-04-20 17:42
运维
系列
hadoop
hadoop
Hadoop运维记录系列(十四)
周末去了趟外地,受托给某省移动公司(经确认更正,是中国移动位置基地,不是省公司)做了一下Hadoop集群
故障分析
和性能调优,把一些问题点记录下来。
Slaytanic
·
2015-04-20 17:42
hadoop
运维
系列
Hadoop运维记录系列(十四)
周末去了趟外地,受托给某省移动公司(经确认更正,是中国移动位置基地,不是省公司)做了一下Hadoop集群
故障分析
和性能调优,把一些问题点记录下来。
Slaytanic
·
2015-04-20 17:42
hadoop
运维
系列
开机屏幕出现Disk I/O error的
故障分析
和解决
近日有用户在电脑开机时出错,提示:DiskI/Oerror,Replacethedisk,andthenpressanykey(如图)英文错误信息,安装“回车键”确认也无法进入系统桌面,下面小编针对此类开机错误进行
故障分析
及解决方法介绍
佚名
·
2015-04-09 08:30
一次enq: CF - contention 导致数据库宕机的
故障分析
数据库意外宕机,alert日志信息如下:SunJul2701:02:482014SystemStatedumpedtotracefile/oracle/app/oracle/product/1020/admin/jcgl/bdump/jcgl2_diag_569650.trcSunJul2701:03:482014Killingenqueueblocker(pid=721256)onresourc
killvoon
·
2015-04-08 13:00
HP DL580G7更换硬盘
一故障现象:硬盘灯告警二
故障分析
:硬盘fault三处理过程:现场查看发现主机配置两块300GB硬盘,且系统正常运行。
chenquanpan
·
2015-04-01 10:27
硬盘
在线更换HP
DL580G7
使用shell脚本解决VMware克隆主机后网络服务无法启动
二、
故障分析
: 此故障是由于使用克隆以后,克隆出来的主机的MAC地址会由软件自动分配一个新的,但是配置文件中MAC仍是原主机。所以因为MAC地址不符造成服务无法启动。
ggvylf
·
2015-03-30 21:08
vmware
网络服务
克隆主机
使用shell脚本解决VMware克隆主机后网络服务无法启动
二、
故障分析
: 此故障是由于使用克隆以后,克隆出来的主机的MAC地址会由软件自动分配一个新的,但是配置文件中MAC仍是原主机。所以因为MAC地址不符造成服务无法启动。
ggvylf
·
2015-03-30 21:08
vmware
网络服务
克隆主机
Linux Web服务器网站
故障分析
常用的命令
系统连接状态篇: 1.查看TCP连接状态 netstat -nat |awk '{print $6}'|sort|uniq -c|sort -rn netstat -n | awk '/^tcp/ {++S[$NF]};END {for(a in S) print a, S[a]}' 或 netstat -n | awk '/^tcp/ {++state[$NF]}; END {fo
·
2015-03-11 10:00
web服务器
Android之
网络丢包
事件
有那么一个应用,同样的服务器端,同样的Wi-Fi网络下,Android连接速度总是慢过iphone一个数量级。起先怀疑跟Android的硬件有关,无奈的是通过3G甚至于2G EDGE无线连接,速度均超过Wi-Fi。然后这个责任就一把归结到了“Android不如iPhone”,“Android七拼八凑”之类无休止的平台沙文主义之上了。 接手这个问题之后,起先也是渺无头绪。先从服务器端的结构说起
104zz
·
2015-03-06 18:00
android
Android之
网络丢包
事件
有那么一个应用,同样的服务器端,同样的Wi-Fi网络下,Android连接速度总是慢过iphone一个数量级。起先怀疑跟Android的硬件有关,无奈的是通过3G甚至于2G EDGE无线连接,速度均超过Wi-Fi。然后这个责任就一把归结到了“Android不如iPhone”,“Android七拼八凑”之类无休止的平台沙文主义之上了。 接手这个问题之后,起先也是渺无头绪。先从服务器端的结构说起
104zz
·
2015-03-06 18:00
android
Android之
网络丢包
事件
有那么一个应用,同样的服务器端,同样的Wi-Fi网络下,Android连接速度总是慢过iphone一个数量级。起先怀疑跟Android的硬件有关,无奈的是通过3G甚至于2G EDGE无线连接,速度均超过Wi-Fi。然后这个责任就一把归结到了“Android不如iPhone”,“Android七拼八凑”之类无休止的平台沙文主义之上了。 接手这个问题之后,起先也是渺无头绪。先从服务器端的结构说起
104zz
·
2015-03-06 18:00
android
Android之
网络丢包
事件
有那么一个应用,同样的服务器端,同样的Wi-Fi网络下,Android连接速度总是慢过iphone一个数量级。起先怀疑跟Android的硬件有关,无奈的是通过3G甚至于2G EDGE无线连接,速度均超过Wi-Fi。然后这个责任就一把归结到了“Android不如iPhone”,“Android七拼八凑”之类无休止的平台沙文主义之上了。 接手这个问题之后,起先也是渺无头绪。先从服务器端的结构说起
104zz
·
2015-03-06 18:00
android
测试
网络丢包
情况代码
import java.io.*; import java.util.regex.Matcher; import java.util.regex.Pattern; public class PingIpUtils { public static boolean isWindowsOS() { boolean isWindowsOS = false; String os
·
2015-03-06 15:00
测试
hbase
故障分析
之-regionserver突然宕机启动后也是宕机
近日发现测试环境中的RegionServer总是突然宕机,重新启动节点依然无效,无耐看了半天日志发现如下信息:2015-02-1305:40:04,325WARN[regionserver60020]zookeeper.RecoverableZooKeeper:Node/hbase/rs/slave2,60020,1423777199540alreadydeleted,retry=false201
大数据交流官方群
·
2015-02-13 14:30
Hbase系列
hbase
故障分析
之-regionserver突然宕机启动后也是宕机
近日发现测试环境中的RegionServer总是突然宕机,重新启动节点依然无效,无耐看了半天日志发现如下信息: 2015-02-13 05:40:04,325 WARN [regionserver60020] zookeeper.RecoverableZooKeeper: Node /hbase/rs/slave2,60020,1423777199540 already deleted,
尘事随缘
·
2015-02-13 14:00
hbase
intel x540-at2 openstack 下桥接故障
当前计划使用intelx540-at2(万兆网卡)建立bonding, 然后转换(ovs)桥接,再为数据包进行vlantag标记故障现象:完成配置后, 发现严重丢包
故障分析
,利用intelx540-at2
signmem
·
2015-02-12 11:00
我们来看下 监控软件 Nagios 和 cacti 结合
来看下两者区别Cacti:在监控方面绘图比较不错,在流量与图型展现比较存在优势 Nagios:在
故障分析
比较不错,报警机制相对来说比较好,报警机制:邮箱、短信等,而且也比Cacti灵活;同时适用监控大量服务器以及服务器上面大批服务状态是否正常
My王企鹅
·
2015-01-28 23:31
服务器
软件包
监控软件
我们来看下 监控软件 Nagios 和 cacti 结合
来看下两者区别Cacti:在监控方面绘图比较不错,在流量与图型展现比较存在优势 Nagios:在
故障分析
比较不错,报警机制相对来说比较好,报警机制:邮箱、短信等,而且也比Cacti灵活;同时适用监控大量服务器以及服务器上面大批服务状态是否正常
My王企鹅
·
2015-01-28 23:31
服务器
软件包
监控软件
coredump
故障分析
coredump叫做核心转存。当程序在运行过程中发生异常,这时Linux系统会将程序出错时的内存内容存储在一个(core.进程号)的文件中,这个过程叫coredump。此功能默认关闭: 开启命令:ulimit-cunlimited(可使用的资源无限制) 关闭命令:ulimit-c0 ;-c选项:当某些进程发生错误时,系统可能将该进程在内存的信息写成文件,这种文件被称为内核文件。此为限制每个内核文件
u011467781
·
2015-01-17 16:00
故障分析
coredump
dns解析超时
故障分析
XX发送接口超时问题排查一句话总结XX发送接口逻辑中调用了YY的http接口,在httpclient中dns解析没有超时控制,导致http调用偶发超时。现象XX上线后,发现线上监控显示发送消息的接口响应时间会有偶发的高峰,查看日志,超时的响应时间多为3-5s,并且在同一时间点出现,最高有9s的超时时间,一台机器每天约有10次左右慢请求(单机send接口qps约1)。排查1.通过业务代码中的分步耗时
qian_348840260
·
2015-01-15 10:18
经验分享
XXX公司内网访问故障处理
故障现场:当用户访问www.sinopecsales.com时出现访问异常,具体如下图所示:
故障分析
:访问其它网站正常,但是访问该网站出现问题,从DNS解析和路径跟踪来看网络并无异常,负载均衡策略和链路状态也正常
xunil
·
2015-01-09 21:39
F5
会话保持
XXX公司内网访问故障处理
故障现场:当用户访问www.sinopecsales.com时出现访问异常,具体如下图所示:
故障分析
:访问其它网站正常,但是访问该网站出现问题,从DNS解析和路径跟踪来看网络并无异常,负载均衡策略和链路状态也正常
xunil
·
2015-01-09 21:39
F5
会话保持
车间AP无法接入
故障分析
处理
故障现象:AP工作正常,原有客户端接入正常,但是先增加的客户端无法连入AP,导致新增无线扫描枪等无线设备无法使用。诊断过程:首先:通过WEB方式远程连接AP,进入控制页面。发现AP在接入时做了MAC地址过滤、并且做了WEP认证。在AP中添加了笔记本的MAC地址,然后到厂区中进行测试,点击连接时提示无法连入无线网络。最初怀疑是接入权限不够,可是更换了相应的密码后仍然不能进入。再次进入控制页面查看,在
xunil
·
2015-01-09 14:46
控制
AP
接入
车间AP无法接入
故障分析
处理
故障现象:AP工作正常,原有客户端接入正常,但是先增加的客户端无法连入AP,导致新增无线扫描枪等无线设备无法使用。诊断过程:首先:通过WEB方式远程连接AP,进入控制页面。发现AP在接入时做了MAC地址过滤、并且做了WEP认证。在AP中添加了笔记本的MAC地址,然后到厂区中进行测试,点击连接时提示无法连入无线网络。最初怀疑是接入权限不够,可是更换了相应的密码后仍然不能进入。再次进入控制页面查看,在
弯月楼主
·
2015-01-09 14:46
控制
AP
接入
车间AP无法接入
故障分析
处理
故障现象:AP工作正常,原有客户端接入正常,但是先增加的客户端无法连入AP,导致新增无线扫描枪等无线设备无法使用。诊断过程:首先:通过WEB方式远程连接AP,进入控制页面。发现AP在接入时做了MAC地址过滤、并且做了WEP认证。在AP中添加了笔记本的MAC地址,然后到厂区中进行测试,点击连接时提示无法连入无线网络。最初怀疑是接入权限不够,可是更换了相应的密码后仍然不能进入。再次进入控制页面查看,在
xunil
·
2015-01-09 14:46
控制
AP
接入
厂区网络拥塞
故障分析
处理
故障现象:行政楼该区部分用户发送邮件时不能发带有大附件的邮件,有时不能打开网页
故障分析
:接到用户的请求后,我们对网络进行了全方面的检测,首先为故障客户端更换交换机接口,但是更换后故障依旧。
xunil
·
2015-01-09 14:53
dns
故障处理
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他