近年来,国内公安系统的信息化建设进入了飞速发展的阶段。一方面是因为公安系统的业务需求从静态到动态、从粗放到集约、从低速到高效的转变,信息技术有效的对现有的应用系统实现整合、提高有限的警力资源分配。另一方面,信息化的高效性,也让公安系统作为政府的服务部门,更好的构建和谐的警民关系。

也正是基于这样的前提,对保障IT系统的正常运行,维护系统对业务的及时响应和执行保障提出了很大的挑战。大连市公安局科技处副处长王春雨对这一点也深有感触,在与作者的交谈中也特别提到了他们是如何应对这一挑战的。“我们的职责是要在少投入的基础上,保证每一个业务系统的运维管理”,王春雨谈到:“我们的技术人员编制是有限的,当时的状况是当班人员每天早、中、晚对系统进行三次检查,这三次中间的时间就等接故障电话,是一个名副其实的救火队,凌晨两三点起来重启服务器是家常便饭。”

公安系统具有公共行政管理和执法办案两大基本职能。在这两大职能板块下的具体工作对IT系统资源的需求分布不均匀。比如户籍管理工作属于公共服务部分,在一些特定的时间段,系统处于高峰期,但多数时间下系统资源处于空闲阶段;而警务工作平台在月底考核时会处于系统井喷状态,如果这两部分的系统资源可以在不同的时间段自动的实现动态调配,对保障系统的正常运行和提升资源利用率都将会是很好的解决方案。

大连市公安局的人口系统、警务综合系统和查询系统是最重要的一线系统,由部署在7台服务器上的共18个应用服务器所承担,他们之间是相互隔离的。WebSphere Virtual Enterprise工具实现了根据业务需求动态分配资源,在资源紧张的情况下首先确保重要的应用获得关键资源和服务,并且系统的运行状态可以被自动化监控,管理员通过运行平台定义异常状态的应急预案,当检测到异常状况,应急预案将在第一时间被自动执行,提高系统的稳定性。

大连市公安局科技处副处长王春雨

“我们并没有单纯的依靠增加硬件资源来解决这个问题”,王春雨谈到:“而是通过将闲置的资源释放出来,满足繁忙应用的需求,提升计算资源的利用率,这样不仅降低了企业的IT投入成本,更重要的是,对于长期的维护也可以尽量的减轻运维管理的负担。”

应用基础架构虚拟化WVE

IBM WebSphere Virtual Enterprise是帮助优化WebSphere Application Server NetWork Deployment环境,智能化管理工作负载、应用程序部署和健康状况的工具,使得Application Server形成一个更加弹性和有效的平台。

WVE在一个单元中的多个节点之间转移容量,满足工作负载的需求,同时也可以利用闲置节点上未使用的空闲容量动态用于需要CPU资源的应用程序。大连市公安局科技处科长时雨田也同记者分享道:“WVE的实时调整能力非常强,调整之后的运行也比较稳定,自动调节应用程序的时间非常短,基本上几分钟之内就可以完成资源的调配。”

NetWork Deployment可以通过对分布式系统的支持来提供会话故障转移的功能,当ND集群环境迁移到一个WVE动态集群环境时,会话故障转移便成为了一项更加重要的需求。在WVE环境中,应用程序位置控制器就可以根据需要运行多少动态集群及他们所在的位置进行决策。Rollout的特性可以将更新部署到应用程序中,并在不中断服务的情况下部署一个更新后的应用程序,这也就意味着应用程序具有持续的可用性。

大连市公安局科技处科长时雨田

“WVE中的健康管理特性改善了应用服务器环境的弹性”,时雨田谈到:“它可以自动检测健康条件,比如内存的泄露等,并且可以采取自动化操作,使信息数据跳过不健康的服务器,基本上消灭了单节点故障的问题。”

虽然这个过程可以自动实现,但是需要配置合适的“健康策略”,也就是必须要定义符合实际的服务水平协议,以便于评估服务是否达到了理想状态。“我们在这个环节会设置对应用程序进行负载测试,来确保应用程序的可伸缩性和稳定性”,时雨田认为:“根据性能测试的可靠数据和收集到的实时运行时应用程序产生的历史统计数据,两者结合起来才能够准确实际的定义服务水平协议。”
 

项目实施成果分享

在整个项目的规划阶段,大连市公安局科技处根据实际情况制定了几大主要的实施目标:第一,以服务质量为核心,包括所有的硬件资源、网络资源、软件管理体现到最后就是服务质量,用户是否满意的问题。第二,系统要有自适应、自动调整的能力。可能随着应用的发展,会突破原先的系统框架,但是即使在调整框架的时候也希望这个过程是在线完成的。

“真正实施通过动态集成的扩张和收缩来实现应用程序的在线动态调整时,我们也是非常谨慎的”,时雨田谈到:“我们同IBM的技术人员做了多次的深入沟通,然后在实验室用接近真实的系统环境来实验测试,在上线阶段,我们也是先拿了一台测试机进行了一段时间的测试,然后逐个系统进行优化升级。考虑到公安系统应用的软件需要一定的稳定性,增加新的工具不能对现有的应用程序做太大的改动,以保证现有应用系统的运行稳定。同时还要确保将现有的运行资源进行充分的挖掘。”

通过WVE的改造,现有的系统机器数量并没有增加,仍然是7台机器。选了2台机器做分发,这样有一台机器坏了另一台机器可以不间断做备份。在机器配置不变的情况下,WVE环境可以支撑更多的应用。如警务综合应用,在其他地区的ND环境部署时至少需要20个以上SERVER的情况下,大连公安则只需要10-12个SERVER即可满足业务需要。

在原来的ND环境下,小机的CPU利用率大约保持在10-20%,在WVE环境下,小机的CPU利用率则可以保持在30%-50%左右。“很明显的一点是”,时雨田说:“提高了Server实例的可用数。在同样的硬件配置下,原来的7台机器在ND环境下最多只能提供18个Server实例,现在WVE环境下的Server实例可用数达到28个,整体资源利用率提高了50%以上”。

通过WVE环境下的健康管理策略,可以自动重启出现问题的Server实例。动态集群可以根据配置自动创建Server实例,自动发布程序,自动修改整个集群中的参数,而不必像ND环境下对每个Server实例都要进行人工的专值管理。通过实施实施灵活的服务策略,健康策略,动态集群的在线调整,可以为应用系统提供伸缩自如的服务能力,自动化调整能力,而且这些应对措施都是在出问题前反应,保障了不间断服务,实现了IT运行的自动化管理。