光纤收发器故障导致的FTP个别文件上传下载错误一例(错误代码:426)

背景说明:

公司部署了一台FTP服务器用于各部门文件备份和分享。

环境:

  • 服务器:HP ProLiant Dl388 Gen9服务器

  配置:

    CPU:Intel Xeon CPU E5-2609 v4 @1.70Ghz
    内存:16G
    硬盘:SAS接口 1T Raid5+热备

  • 服务器操作系统:Windows Server 2016 x64

  • FTP服务端:Serv-U MFT Server(64bit) v15.1.6.31

  • 客户端操作系统:Windows7_x64以及WindowsXP

  • 网络拓补结构:

网络拓补结构

问题描述:

  连接A交换机的PC用户反馈有个别文件不能通过IE上传到服务器,但可以使用FTP客户端(FTP voyager 16.2.0.328)上传,而上传的文件,其他用户使用IE又不能下载。
  过了一段时间连接B交换机的PC用户又有同样的问题反馈。
  在用户上传时,本地会报“将文件复制到FTP服务器时发生错误。请检查是否有权限将文件放到该服务器上。详细信息:与服务器的连接被重置”,如下图:


上传报错

  而用户下载时,本地会报“复制文件时发生错误。操作超时”,如下图:


下载报错

  Serv-U上的面的日志中分出现错误代码为426 的报错,报错内容如下:
 (000293)发送文件 "F:\DATA\FtpData\部门\网管\td.pdf" 时发生错误,中断操作 (393,216 字节)
 (000293) 426 Data connection unexpectedly closed, file transfer /#2.网管/td.pdf aborted by client.

故障排查

  排查过程

  当用户反馈某个文件不能上传或是下载时,我发现该文件在连接A交换机和B交换机上的任何一台电脑上,使用任何FTP帐号都无法上传下载,报错信息相同。但在连接C交换机上的电脑上上传下载则正常,所以排除掉Serv-U设置的问题。
因为FTP服务器是连接在C交换机上的。通过以上现象我开始推断是网络故障导致的该问题的发生。于是着手排查网络方面的故障。
  因为所有的连接都是基于二层交换机,中间不经过三层或是其他网管设备,我只能在A交换机以及B交换所连接的电脑上与C交换机连接的电脑进行ping命令测试,结果延时也很小,无丢包。
所有的电脑都是通过连接在A交换机上的路由器(上面拓补图中未画出)连接internet网络的,我通过在C交换机上连接的电脑上测试下载速度,发现速度正常,同时系统中的其他网络应用均正常。
  在A交换机以及B交换机连接的电脑上使用FTP上传下载大文件以及T级超大文件,发现都正常,正有上传下载用户反馈的那个文件时才会出现异常。
  基于上面的测试,又推翻了自己做出的网络故障的判断,决定还是先从软故障的角度来查找原因。
  因为总是固定的文件不能上传或是下载,于是又怀疑文件损坏,但测试发现无论是用户本地的文件,还是通过其他文法放置到服务器上的该文件都可以直接在本地或是服务器上打开,排除了文件损坏的可能。
测试中发现,仅仅是使用系统自带的IE来上传下载文件时会发生故障,而使用FTP客户端则没有此问题。但因为考虑到很多用户的计算机使用水平并不能很好的使用FTP客户端,所以此问题仍旧要解决。
  因为仅仅是使用IE上传下载时会有问题,所以怀疑是IE中的主动模式(PORT)和被动模式(PASV)设置造成此问题,但通过修改IE中的相关设置,发现故障现象仍然存在。
  到目前为止毫无进展,上网查了一些资料,很多人提到了防火墙可能导致该问题,于是继续测试在本地以及服务器上都关闭掉防火墙和杀毒软件之后上传下载的结果,故障仍然存在。
到这一步基本上就进入了死胡同。

  陷入死胡同

  因为找不到相应的解决办法这个故障随后就搁置一边,一搁就将近一年,一年中又碰到过三四次报修,虽然文件不同,故障现象一致,基本上都临时通过比较Windows文件夹共享之类的方法做了处理。

  转机

  在一次维修PC的过程中,我将一台连接在A交换机下的电脑主机搬回到办公室,连接到C交换机上,在安装软件的过程中无意中从FTP服务器上下载了之前不能下载的文件,而这台电脑连接在A交换机时,该文件是下载不成功的。至此我又重新将之前推翻的网络原因导致的故障的想法又拾起来了。

故障解决

  就之前的情况咨询一位行业中经验丰富的老大哥,该位仁兄让我不要想那么复杂,之前推测的网络原因可能就是正确的,建议直接将连接AC交换机的光纤收发器更换掉试试看。根据其建议更换了两端光纤收发器,再次测试,故障消失,问题解决。

以下就是出问题的光纤收发器:

总结

  问题虽然解决了,但我现在仍旧不能判定这个光纤收发器是坏的,因为在实际使用过程中除了目前提到的问题,该光纤收发器表现良好,所以我只能牵强的定性为兼容性不好。
  故障虽然解决了,但有时候还真不能把问题想的太复杂,这起案例就是典型的把问题复杂化导致故障解决走了很多弯路。

你可能感兴趣的:(光纤收发器故障导致的FTP个别文件上传下载错误一例(错误代码:426))