面试题:作为linux运维,客户反映打开你的网络服务器很慢,如何排错(运维)?

(一)用户个例,还是全部

自己把自己当做用户去测试。如果没问题,就从客户的角度去思考,如果自己测试同样有问题,按照下面思路排查。

1.路是否通的问题

a. ping www.baidu.com高速路有没有修好

如果ping是通的,不丢包。http服务器的问题(服务宕机了,服务过载了)

如果ping是通的,丢包,机房带宽不稳定,各个线路不稳定。

如果ping不通,ping qq.com 机房宕了,或者http服务的问题(服务宕机,服务过载了)

b.tracert -d www.baidu.com 高速的各个路段有没有修好,从客户端到服务器之间各个线路,让机房配合检查。

2.机房业务是否OK

c.telnet www.baidu.com  80检查服务器WEB服务有没有开启以及防火墙有没有挡住。

nmap www.baidu.com  -p 80

curl www.baidu.com 或者wget www.baidu.com相当于浏览器访问。

d.提供服务的服务器是否资源过载,服务器及服务连接数过多,负载高,cpu高,IO高。 

3.外部问题

e.网站购买的带宽满了,通过流量监控服务查看。

f.内链外链(调用外部网站网址有问题)

必不可少的重要调试网站前端的工具

根据网站URL调试网站

  1. google浏览器直接F12

  2. 2.过户firebug,yslow

  3. ie httpwatch


4.其他问题

个别客户自身问题,例如:运营商线路和网站带宽的线路不符。

5.集群架构(数摆台服务器提供服务)

g.WEb服务问题。

h. 数据库问题,登录数据库,看是否有慢查询语句show proceslist ,调整MYSQL,优化SQL语句。

i.存储等的问题,是不是存储服务器,如NFS,MFS的负载及磁盘IO高?

更改更复杂的网络环境的排查方法,架构师再讲。