硬件的质量是整个IT系统的质量保证基石。在复杂的集成应用系统中,某些单点故障可以通过软件的方式来实时监测、规避并临时解决。本文的重点不讨论如何通过软件的手段来保证IT系统的稳定性和可靠性,也不讨论硬件质量的保障体系,而是从最基本的硬件板卡测试的角度来介绍如何做出厂测验的。
以下知识是以网络设备为蓝本进行介绍的,网络设备是进行网络流量处理的设备,大部分设备是由不同的板卡组成,包括管理板、处理板、交换板、机框等。其它产品如通用的终端类设备(如手机)、IT类设备(服务器、存储)等只要跟硬件有关的设备都可以类比。
介绍之前,先跟大家简单普及几个知识,以使没有接触过相关领域的人也能轻松理解。
1、硬件的电子元器件是有一定概率出现质量缺陷的,即使再高的生产工艺也很难保证质量100%符合要求,所以各阶段的检测是非常有必要的;
2、硬件板卡的出厂测验基本上是硬件质量保障靠后的环节,因为已经度过了前期的硬件设计、硬件测试,中期的小批量试制、质量评估分析改进等,出厂测验属于后期大批量生产供货阶段的测试;
3、硬件板卡的出厂测验是不能提高硬件质量的,只能尽最大能力检测出异常的板卡,避免故障板卡交付用户,硬件的质量还需要从源头(硬件设计)上进行控制和保障;
4、硬件板卡的出厂测验是必须要有的环节,不可缺失,也是交付用户前的最后屏障;
5、硬件板卡的出厂测验一定要把握适度的原则,过粗容易漏掉关键部件检测,过细容易影响交付时间,要根据实际情况,灵活把控;
6、硬件板卡的出厂测验一定要尽量使用自动化的方式,降低操作门槛和技术难度;
7、硬件板卡的生产一般都是代工的方式,很少企业有自己的产线并能达到尖端水平,所以这里面必然牵涉到供应商之间的合作;
8、硬件板卡的出厂测验的流程和环节一定要设计到位,且不断优化调整,持续改进;
根据多年的工作经验及实践,总结下我们的硬件板卡的出厂测验的流程,主要分三大步骤:
1、代工厂的板卡检测;
2、我们自己的工厂的入库检测;
3、交付用户前的出库检测;
这三大步骤组成了我们硬件板卡的出厂测验及基本流程,保证了出厂的硬件质量要求,也是我们摸索了多次的成功实践。
代工厂的板卡检测
主要的流程分为如下几步:
1、板卡焊接:板卡所有物料齐备后,即可以开始焊接;
2、裸板硬件测试:不上电前的测试,主要是为了保证板卡无短路焊接情况,防止烧坏;主要测量的方式是测量电压;
3、裸板业务测试:单板上电,通过自制的测试环境,使用自动化的方式测试,通过业务软件来反向验证硬件的正确性;主要测量的方式是通过测试环境使用业务软件反向测试硬件裸板;
4、板卡上框测试:裸板业务测试通过后,会进行机壳安装、部件安装等,组成完整的单板,需要配合机框进行测试;主要测量的方式是通过测试环境使用业务软件反向测试硬件单板;
5、板卡交互测试:不同类型的板卡完成1-4步骤之后,会进行板卡直接的交互测试,以保证各类型板卡能够正常工作,流程4和5部分情况下也可以合并;主要测量的方式是通过测试环境使用业务软件反向测试硬件整板;
整个测试过程中,一定要保存每个板卡的测试数据和测试结果,以保证后续的故障追溯及问题分析定位。一般我们对代工厂的要求有如下几点:
1、测试报告(严格按照测试点进行测试,编写测试报告);
2、测试数据(过程数据及结果数据);
3、测试说明(测试人员、测试时间、测试板卡编号等辅助信息);
4、流程和规范化严格按照我们要求执行;
5、双向的审查和考核机制(约束供应商,同时也不断完善流程);
所有的板卡测试完之后,会按照要求打包,入库到我们自己工厂。
自己工厂的入库检测
入库到我们自己工厂的板卡都是成品,也即是完整的板卡。我们的检测主要分为三步:
1、来料外观检测:主要检测包装合规性、板卡外观等;
2、来料板卡检测:再次执行代工厂板卡检测的第五步;主要测量的方式是通过测试环境使用业务软件反向测试硬件整板;依据测试要求及测试点,执行检测,给出测试结论;
3、来料入库:如果上述都没有问题,则作为正式的成品入库保存;标明入库品、入库时间、入库人等辅助信息;
自己工厂的入库检测起着承前启后的作用,既是对代工厂板卡检测工作的检查和审核,又是硬件质量管理的必要环节。
交付用户前的出库检测
在接到用户订单后,我们会进行出库前的检测及环境部署,以保证交付的质量,我们出库检测主要分为如下几步:
1、按照订单领料:按照用户的要求,进行板卡及配件的领料,保证领料的正确性及完整性;
2、按照测试要求进行测试:按照用户配置,进行版本部署、硬件出库前的检测(主要是基本功能测试、故障模拟、配件测试等),保证到达用户现场正常使用;
3、订单出库:按照公司统一要求,如光盘、手册、合格证等,进行测验及打包包装,入交付库,等待销售提取对应货物;
这个环节是按照用户的订单要求,进行版本部署,故障模拟测试,整机测验,配件检测等,保证设备交付到用户现场即可正常使用。
目前用户的要求比较多,设备的定制化程度比较高,必须在交互用户前做一系列检测,保证硬件的质量。
小结,以上三个环节环环相扣,每一个环节都至关重要,不能偷工减料,更不能忽略;是构成出厂测验质量保证的基本操作;其它的产品也可以按照类似的步骤进行推广及落地。