NTT大规模网络故障

5月15日晚上约18点44分,NTT东日本营业区域的14个都道县内,所有NTT的Flets光纤网络、以及使用了光纤网络的IP电话突然之间都不能使用了。在大规模使用IP电话代替传统电话的日本,这是非常严重的事故。将近300万网络用户和60万的IP电话用户受到影响。经过NTT公司的紧急修复,终于在午夜1点35分完全恢复了网络使用,整个过程历时约7小时。

NTT立刻对事故原因进行了调查。根据5月16日发布会议上的消息,事故原因起始于设置在东京的藏前的一台路由器。具体情况是,15日晚,该路由器发生故障,于是工作人员用备用路由器将其换下。这一设备交换导致网络结构改变,因此网络上的其余4000多台路由器都会更新路由表。到这里为止都是正常的维护步骤。

但是,这一路由表的更新却因此了重大的后果——大规模路由更新导致路由器达到了其处理能力的上限,于是整个IP网络就瘫痪在来不及处理的拥塞之中了。NTT在发现这一问题之后立即通过重新启动路由器等方法进行恢复,终于在午夜1点半左右全部恢复。

为避免今后再次发生类似问题,NTT公司公布了如下对策:一是减少路由器的路由信息以求降低负载,把每台路由器管理的路由信息从1万5千条降低到1万3千条。此外,对于路由器软件版本较旧导致处理性能不佳的,通过更新软件版本提高处理能力。

NTT公司的副社长和高层官员在说明会上进行了谢罪。但是并不会因为本次事故对用户进行赔偿或退款,因为协议上规定的是24小时以上服务中断时返还费用。
NTT大规模网络故障_第1张图片

***技术内容的BLOG已经转到 CodeSoil,欢迎前来参观。

你可能感兴趣的:(NTT大规模网络故障)