数据仓库之路,保险业应如何走

1980年恢复国内保险业务以来,中国的保险业保持了持续快速、健康发展的良好势头,业务规模不断扩大。特别是近几年来,新的市场主体不断涌现,随着我国保险市场的逐步开放,已经有越来越多的外资保险公司进驻国内市场,市场竞争日趋激烈。同时,从国内保险业信息化建设看,在“十五”期间,特别是党的十六大以来,保险业稳步推进核心运营系统平台的改造,绝大部分保险公司实现了业务、财务数据处理的全国集中,数据大集中建设取得了显著成效。面对日益激烈的市场竞争和自身需做大做强的历史使命,国内保险业迫切需要由以前的粗放式经营向精细化管理转变,迫切的需要以数据为基础做出科学的决策,数据大集中也为数据的分析利用提供了基础条件。因此,数据仓库的实施与应用得到了快速发展,成为近年来保险业IT应用的一个热点。中国保监会在20061225日印发的《中国保险业发展“十一五”规划信息化重点专项规划》中明确要求:树立“数据是资产”的理念,不断提高数据的质量,开展数据模型的研究,充分利用数据仓库和数据挖掘的先进技术,加强数据分析,深入挖掘保险数据资产的潜在价值,为科学设计保险产品,加强核保核赔风险控制,改善经营管理决策,促进保险创新发展提供重要依据。下面,笔者根据自己近几年来保险行业数据仓库的规划与实施经验,从四个方面谈谈在现阶段,数据仓库之路,保险行业应如何走。

切勿从零开始

国内外大量的实践证明,从零开始设计和建立数据仓库是一个惨痛的失败教训。从零开始,意味着企业将花费漫长的时间和巨额的资金在前期行为上,包括收集需求、理解业务、设计模型、建立ETL模版以及建立分析查询等。而不断变化的业务常常导致需求的变更,使我们不得不重新调整数据模型、修改ETL程序等,这蕴含着巨大的风险。如何才能避免上述时间长、成本高、风险大的数据仓库实施过程?答案是:从成熟的行业数据仓库解决方案开始构建你的数据仓库。

保险行业比较成熟的数据仓库解决方案,典型的有IBMIIWNCRFS-LDMSybaseIWS等。这些行业数据仓库解决方案是众多业务专家和数据仓库技术专家合作开发,并经过大量实践检验的完整的解决方案,汲取了多年来众多数据仓库项目的成功经验和失败教训,是智慧的结晶。采用这些成熟的解决方案,将使企业从一个很高的起点开始,以最短的时间、最低的成本和最小的风险构建数据仓库,使企业赢得最大的投资回报。

标准化建设要先行

数据仓库建设,标准化要先行。标准化,对数据仓库来说,最重要是指标标准化。目前,在国内的保险公司内,“数出多门”的现象仍大量存在。公司的各个部门从自己的职责出发,给同样的指标赋予了不同的统计口径,例如保费收入指标,销售部门多倾向于按签单日期统计,而财务部更多是按实收日期统计等,这样往往引起管理上的歧义,影响数据的使用。标准化就是要消除这种歧义,消除同一指标在不同系统、不同部门之间的不一致性,在企业范围内建立统一一致的数据,一个指标只能有一种解释,一个核算口径。

中国保监会已于2006年启动了行业标准化建设,并于2006年年底颁布了《保险术语》标准,并将于2007年下半年颁布标准化的业务、财务指标集,在建设数据仓库时,要充分利用并严格执行这些标准。

要坚持对数据质量的改进

数据质量是数据的生命,只有高质量的数据才能发挥出数据的价值,低质量的数据会使管理者做出错误的决策,正如谚语所说:“Garbage in, Garbage out”(进去的是垃圾,出来的也是垃圾)。现阶段,保险行业的数据质量不够理想。造成数据质量不高的原因有很多,例如业务流程不规范、核心业务系统技术缺陷、人为操作疏忽、数据补录、手工数据未上机、核算口径不统一等。这些低质量的数据不能真实的反映业务情况,严重影响系统的推广使用。

对此需要优先开发用于数据质量控制的模块,根据数据探察规则发现数据质量问题,对数据质量的偏离程度进行估算和展示,对超过预订范围的予以警示,由此促进在流程、规范等各个方面的改进,逐步提升数据质量。数据仓库应与核心业务系统等生产型系统形成良性的互动,一方面核心业务系统等生产型系统是数据仓库的数据源,另一方面,数据仓库暴露出的数据质量问题应能反馈到生产型系统中去,促进生产型系统流程的改进,提升数据质量。数据质量的提升是一个长期的过程,应贯穿数据仓库系统建设的始终。

整体规划,分步实施

数据仓库系统是数据分析型应用,不同于生产型系统是为解决某个特定的实际问题,其建设是一个庞大的系统工程,通常周期较长,投入较大。并且,数据模型是数据仓库的核心,目前在国内还没有成熟的、完整的保险行业数据模型, 国外虽然有IBMIIWNCRFS-LDM等成熟的数据模型,但这些国外的数据模型目前在国内还没有完整的客户化经验。因此,数据仓库建设不可能一蹴而就,需要整体规划,分步实施,即长远的规划与分步实施的具体行动相结合。

分步实施是指在整体规划的基础上将总的开发任务化整为零,分解为各类应用的迭代开发,使系统能够逐步见效,分步实施的基础是整体规划,两个核心是迭代开发和逐步见效。

整体规划是分步实施的基础,在建设初期就要做好数据仓库的整体规划,这样可以保证系统的完整性,使分步实施的每个阶段之间能有很好的衔接。迭代开发是指在分步实施的每个阶段,采用迭代的开发方式,快速的开发出原型,不断的和用户交互,保证开发出的系统是用户真正需要的系统。逐步见效是指通过有计划的、逐步发布已开发的功能,切实帮助用户解决某类实际问题。这样做的一个重要目的就是将项目开发的成果及时提供给业务人员使用,帮助其解决实际问题,使其乐于接受系统,并逐步培养其对项目的归属感,使用户充分参与到系统建设中来,也逐步培养其使用系统进行分析的习惯。逐步见效另一个更重要的目标是向企业业务部门展示项目进展情况和发展方向,促使系统的自我优化能力,通过对每次迭代应用成果反馈意见的分析,可以获取更全面、更深入的需求来完善下一步的迭代实施内容,并保持项目的发展不偏离预期目标。
本文发表于《金融时报》

你可能感兴趣的:(数据仓库之路,保险业应如何走)