集装箱码头企业IT运维思路

在国际集装箱码头IT部门工作了5年,在改行之间简单记录一下目前工作思路(如果还继续做这行的计划^^):

1、IT运维的目标:

1)保证码头操作系统的稳定运行,确保装卸船作业、进出闸作业、堆场作业,查验作业等主要业务7X24不停止。

2)保证码头各作业设备上的指令终端可用率高,尽量避免因终端故障而更换大型作业设备。

3)保证码头作业计费、开票业务7X24小时不停止。

 

2、保证措施

1)保作业系统稳定

      A、测试标准化,让测试任务、责任和利益相关联,谁收益谁负责。尽量避免系统带BUG上线;

      B、权限管理和配置变更标准化,每一个配置变化都要说明原因、影响、测试结果、风险分析、紧急预案,做到谁主张谁负责;

      C、常规问题需要汇总解决方案,让一线人员快速可查,按规范执行,迅速解决问题;

      D、二线人员要了解系统内部全部运行流程和逻辑和系统部署,做到问题能快速判断,并正确给出解决方案。

     E、硬件方案尽量做到热备和冷备,模拟演练系统切换操作,正式系统不采用未熟练掌握的新技术。

2)保终端设备可用

       A、因终端故障不可能100%避免,所以可以改善的是在发生故障后以最快的时间恢复:终端小型化,安装快速化,配置简单化。让换一个终端流程时间花费从一个小时降到几分钟。

      B、硬件工程师24小时轮值,保证不因小硬件问题让大型设备停机的事情发生。

3)保计费可用

     A、计费和生产系统做同一高级别配置和管理;系统记录变更过程,做到谁操作谁主责。

     B、只将已经明确的作业数据推送给计费,不推垃圾数据;

     C、批量计费只在闲时处理,保证现金收费计算快速响应,不超时。

     D、计费失败或成功后数据归档和回退机制要完善,避免中间数据未清理干净影响后续计费。

 

你可能感兴趣的:(IT运维管理)