前段时间公司网站发生一些用户访问不了的情况(主要分布在北方),报错是如下图等

 

故障处理记录 ---- ISP的骗局 nginx/fd2 502 Gateway Timeout_第1张图片

 

比较奇怪,公司网站是使用的nginx ,但没有把版本信息修改成 fd2 ,像是客户上网那个地方代理后报的错误。

从运营同事那里获取部分故障用户的QQ,远程支持发现以下情况:

ping 解析处理的ip正确,但ping不通,到网站网通ip ping 测试正常。修改用户本地hosts,访问正常。

多个访问故障的用户都是该情况,收集客户的外网ip,和其解析的dns ip,发现都是铁通的ISP,其用来dns解析的ip也是铁通。

故考虑批量解决这个问题,修改公司智能dns,把所有铁通ip来源查询结果返回 网站联通ip地址,并请运营相关同时看看是否还有新的客户反馈,以及出现故障用户是否恢复正常访问。

铁通ip地址列表:

 

58.66.0.0/15

58.82.0.0/15

61.232.0.0/14

61.236.0.0/15

61.243.56/21

121.36.0.0/17

121.40.64.0/22

121.40.224/20

121.41.0.0/22

121.41.128/17

121.42.0.0/15

121.46.0.0/16

121.51.0.0/16

121.55.0.0/18

121.68.0.0/15

122.0.0.0/16

211.98.0.0/16

222.32.0.0/11

 

经过两天观察后,未出现新的该类故障用户,已出现故障的用户也恢复正常访问了。

今天(2012-8-14)收到一个用户反馈同样问题,是使用的移动的线路,有待观察是否做同样处理)

今天(2012-8-14)收到一个用户反馈同样问题,使用的铁通的线路,但其请求的dns服务器居然是境外的,有点奇怪

 

故障处理记录 ---- ISP的骗局 nginx/fd2 502 Gateway Timeout_第2张图片

 

 今天(2012-8-21)收到一个移动线路的客户报告该故障:

 

故障处理记录 ---- ISP的骗局 nginx/fd2 502 Gateway Timeout_第3张图片

出现情况较多,把所有移动ip列表查询,返回网站联通ip。

移动IP列表

 

36.128.0.0/10;

39.128.0.0/10;

103.23.164.0/22;

111.0.0.0/10;

112.0.0.0/10;

117.128.0.0/10;

120.192.0.0/10;

183.192.0.0/10;

211.103.0.0/17;

211.136.0.0/14;

211.140.0.0/15;

211.142.0.0/17;

211.142.128.0/17;

211.143.0.0/16;

218.200.0.0/14;

218.204.0.0/15;

218.206.0.0/15;

221.130.0.0/15;

221.176.0.0/13;

223.64.0.0/11;

223.96.0.0/12;

223.112.0.0/14;

223.116.0.0/15;

223.120.0.0/13;