周三临时接到上司命令说这周六加班做一个交易所的连通性测试,我和石兄未能幸免,妥妥成为了加班人选。

 “靠,好不容易熬到一半了,突然喊加班,大好的周末又泡汤了!” 石兄表示非常愤慨。

 “知足吧你,还好能调休啊“ 我也表示无奈的说。

    这时有关测试的详细配置流程的邮件也发过来,打开附件粗略看了看,好几十页的说明呢。大概意思就是演练一个接收多播数据的连通性测试,分为现场测试和远程测试。现场测试需要携带笔记本到机房连到相应的测试交换机端口,运行官方提供的测试工具来验证接收数据是否成功。而远程测试则只能采用我们目前线上的服务器,将其中已有的一块网卡IP配置为要求的VLAN所在IP地址,同时网卡所连接的交换机端口也要修改对应的VLAN,才能确保和交易所的网络连接是正常的,剩下的测试则由我们运行自己的工具来验证连通性。

    我们当然希望能到现场去喽,还能免费坐飞的去旅游旅游,哈哈,那是不可能的,只能老老实实在办公室里对着电脑屏幕远程shell吧。

    石兄忙着回信给交易所询问我们需要给交换机配置的VLAN和地址,我则忙着测试程序员开发的一个在Linux系统下面运行小工具。

    这个拓扑图就是连接交易所网络需要用到的

周末加班连通性测试演练_第1张图片

    Switch 1和2就是我们自己的主和备交换机,线上服务器就通过这2台交换机连入交易网络。

    测试开始后,multicast server就会通过特定的VLAN发送多播数据出来,通过交易所的网络到我们的网络设备后再传输到我们的服务器。

    我们需要做的就是在服务器端确认接收数据成功。

    这剩余的2个工作日我和石兄就仔细读读文档,做好前期的准备工作。

    到了周五下午,线上服务器已结束交易进程后,我开始动手给服务器端配置好网卡IP,该服务器当前使用了3个网络连接端口,一个端口做日常管理连接用,另外2个连接到交易网络。我选定了其中一个连接交易网络的端口作为修改对象,备份其原配置后,将石兄所给的IP/子网掩码配置到该网卡上,同时添加相关的路由到该网卡IP,重启了网络服务,测试工具已拷入服务器并写了一个利用该工具批量测试接收多播数据的脚本。

    第二天,石兄早早就来到办公室,已经配置好了交换机的VLAN和端口,

    ”你这么早就到了?!“ 我问道

    ”早起的鸟儿有虫吃呗。“ 石兄懒懒地说道,似乎有些没有睡醒的样儿。

    我打开xshell连接到那台服务器,已能ping通VLAN的网关地址,看样子网络是通了。

    10点整,测试开始了,我运行了那个测试脚本,同时用ps -ef 看到测试工具后台启了几十个进程同时在跑,每个进程的输出结果分别重定向到不同的文件里。

    ”咦,不对呀,输出的文件大小全都没有增长呢?看样子没有接收到数据。“ 我问到石兄。

    ”不可能吧!我这边交换机都是全配置好了的。“石兄斩钉截铁的说。

    我又Ping了下VLAN的网关地址,”奇了怪了,通的呀,难道是交易所那边还没开始么?“

    于是我打电话过去问交易所的技术支持人员,被告知测试已经开始了,那么问题是出在我们这边了。

    我敲route -n 让石兄检查一下路由信息,

    ”不对,你少配了2条路由条目。“ 石兄告诉我说。

    原来我昨天配置的时候一不留神少配了2条路由,粗心呐,赶紧加了上去。

    我又继续观察输出的文件情况,”还是没有增长呢?!你还是给看看你交换机上面的配置吧!“ 

    石兄无奈又开始检查交换机的配置,此时已经10点30分,距离测试结束还有1个半小时。

    找了半天依然没有结果,我继续给对方技术人员打电话,同时让石兄把他的交换机配置情况发邮件给对方看看。

    对方告诉他说少配置了一条命令,他又立即给加了上去,我马上又接着检查测试结果。

    ”嗨,终于有数据接收到了。”看到文件容量增长, 我兴奋地说到,“不过另外一个网段的数据收不到。”另一个网段是指secondary site发送的多播数据。

    “也就是说primary site的数据我们是能够接收到了,为啥secondary site的数据收不到呢” 石兄似乎有些愤怒,仍一直坚持自己的配置是正确的,但还是不得不继续查找原因。

    我在服务器端只能看到primary site有输出结果,而secondary site始终收不到数据,此时已11点整。

继续联系对方技术人员,似乎对方从交换机配置上面也不能找出什么问题来,时间依然继续推进。

    “咦,貌似都通了!之前有问题的输出文件容量在持续增长了,说明都在接收数据了,怎么回事?” 我疑惑地问。

    “诡异的问题,我shutdown了VLAN后再开启,你那边就通了!?这算思科的bug还是怎么的。” 石兄也是满脸疑惑的样子。

    “哎,不管黑猫白猫,能抓住老鼠的就是好猫!能测试通了就行。” 看着测试数据的输出容量增长,我长舒一口气,紧张的心情总算舒缓了下,测试终于成功了。

    时钟指向正午十二点时,测试结束,我和石兄分别恢复了服务器和交换机的原配置,把测试数据整理了,给上司们发了封总结邮件,报告今日测试演练成功,这也是我接触的第一次所谓的实战演练,就这么跌跌撞撞的走过,还得好好总结总结,以免下次再犯这么多的失误。