动态数据仓库发展演变的五个阶段

--NCRTeradata事业部首席技术执行官StephenBrobst
--战略技术及系统公司首席顾问JoeRarey

最成功的数据仓库都是以循序渐进的方式逐步发展起来的,它的每一次发展都提高了信息的商业价值。近年来,数据仓库已经发展到能支持企业决策,甚至支持企业合作伙伴和客户的新高度。
早先,数据仓库只为企业内部高层的某些领域提供战略决策能力,如市场营销、战略策划和财务。数据仓库提供的信息极大地改善了这些部门的决策质量。然而,在当今竞争异常激烈的商业环境中,优秀的战略仅仅是成功的诸多要素之一。若不能付诸有效的实施,任何战略都将是一纸空文。
新一代的数据仓库应用不仅改善了企业战略的形成,更重要的是发展了战略的执行决策能力。本文讨论数据仓库的五个发展演变阶段,这也是企业内部决策支持走向成熟的五个阶段。

第1阶段:报表
最初的数据仓库主要用于企业内部某一部门的报表。数据仓库把机构内不同来源的信息集成到一个单一的仓库中,就可以为公司跨职能或跨产品的决策提供重要参考。在大多数情况下,人们事先已对报表中涉及的问题有所了解。因此,数据库的结构可根据问题的要求进行优化,即使数据查询人员要求访问的信息量极其巨大,处理这些资料的效率仍然可以很高。
构建第一阶段的数据仓库所面临的最大挑战是数据集成。传统的计算环境经常有上百个数据源,每一数据源都有独特的定义标准和基本的实施技术。要对这些放在不同生产系统之中、不具备一致性的数据进行清洗,建立一致性的数据存储库是非常具有挑战性的。
本阶段所建立的优化集成信息是给决策者使用的,同时也为以后数据仓库的发展奠定了基础。
第2阶段:分析
在数据仓库应用的第二阶段,决策者关心的重点发生了转移——从"发生了什么"转向"为什么会发生"。分析活动的目的就是了解报表数据的涵义,需要对更详细的数据进行各种角度的分析。第二阶段的数据仓库对数据库要提交的问题事先一无所知,采用的方法主要是随机分析。其中的性能管理依赖于关系型数据库管理系统(RDBMS)的先进优化功能,因为这与纯报表环境不同,信息查询的结构关系是无法预知的。
第二阶段的数据仓库应用中,由于信息库的应用具有很高的交互性,所以性能问题非常重要。报表一般是根据业务日程安排定期提供的,而随机分析基本上是在交互环境中反复提出并不断优化问题的操作。业务用户希望通过图形用户界面(GUI)直接访问数据仓库,不希望有编程人员作为中介。支持数据仓库的并发查询及大批量用户,这是第二阶段应用的典型特征。
业务用户往往非常没有耐心,所以必须建立联机分析处理(OLAP)环境,向下挖掘的反应时间以秒或分钟来计算。采用索引和复杂的表连接技术,使得数据库优化器可以找到高效率的访问路径。所以,优化器技术对于在可接受的响应时间内灵活地存取信息至关重要。
第3阶段:预测
当一个公司决策过程得到量化以后,对经营动态的情况以及这种情况为什么发生都会有所体验,下一步就是要将信息用于预测了。很明显,掌握公司即将发生的动向意味着更为积极地管理和实施公司战略。数据仓库发展的第三阶段就是提供数据采集工具,以便利用历史资料创建预测模型。
利用预测模型进行高级分析的最终用户为数不多,但建模及评测的工作量极大。一般而言,建模需要用数百种复杂方法度量几十万(或更多)的观察数据,以便形成适合于一组特定商业目标的预测算法。评测也常常被用于大量(数百万)的观察数据,因为需要对整体进行评测,而不是对建模所用的少量数据进行评测。
为了得到所需的预测特性,高级数据分析通常要应用复杂的数学函数(如对数、指数、三角函数和复杂的统计函数)。对算法的预测效果而言,获取详细数据是非常重要的。一些工具(如SAS和Quadstone)为开发复杂模型提供了框架,不过它要求直接访问数据仓库关系结构中所存储的信息。面对此类应用,您必须考虑数据仓库的能力!少数用户可能在高峰期轻易地消耗掉数据仓库平台上50%或者更多的资源。资源消耗之所以这样巨大,原因在于数据访问过程复杂,而且数据处理量很大。
第4阶段:营运导向
数据仓库演变的第4阶段是动态数据仓库。第1到第3阶段的数据仓库都以支持企业内部战略性决策为重点,第4阶段则重在战术性决策支持。数据仓库对战略性决策的支持是为企业长期决策提供必需的信息,包括市场细分、产品(类别)管理战略、获利性分析、预测和其他信息。战术性决策支持的重点则在企业外部,为执行公司战略的员工提供支持。
一般而言,数据仓库的"运作"是指为现场当时决策提供信息,例如及时库存补给、包裹发运的日程安排、路径选择等。许多零售商都倾向于由供货方管理库存,自己则拥有一条零售链和众多作为伙伴的供货厂商,其目的是通过更有效的供货链管理来降低库存成本。为了使这种合作获得成功,他就必须向供货商提供有关销售、促销推广、库内存货等详细信息的知情权,之后便可以根据每个商店和每个单品对库存的要求建立并实施有效的生产和交货计划。为了保证信息确实有价值,必须随时刷新信息,并对查询做出非常快的响应。
以货运为例,统筹安排货运车辆和运输路线,这需要进行非常复杂的决策。常常需要将一辆卡车上的部分货物转移到另一辆车上,即重新进行配载,以便以最高的整体效率送抵各自的目的地。当某些卡车晚点时,就要做出艰难的决定:是让后继的运输车等待迟到的货物,还是让其按时出发。如果后继车辆按时出发而未等待迟到的包裹,那么迟到包裹的服务等级就会大打折扣。反过来说,等待迟到的包裹则将损害在后继运输车上其他待运包裹的服务等级。
运输车究竟等待多长时间,取决于需卸装到该车辆的所有延迟货物的服务等级和已经装载到该车辆的货物的服务等级。很显然,第二天就应该抵达目的地的货物和数天后才需抵达目的地的货物,二者的服务等级及其实现难度是大不相同的。此外,发货方和收货方也是决策考虑的重要因素。对企业盈利十分重要的客户,其货物的服务等级应该相应提高,以免因货物迟到破坏双方关系。延误货物的运输路线、天气条件和许多其他的因素也应予以考虑。能够在这种情况下作出明智的决策,相当于解决了一个非常复杂的优化问题。
显而易见,零担散货部经理应在先进决策支持功能的帮助之下,有效地提高其计划和路径选择的决策质量。更重要的是,若要实现数据仓库的决策功能,作为决策基础的信息就必须保持随时更新。这就是说,为了使数据仓库的决策功能真正服务于日常业务,就必须持续不断获取数据并将其填充到数据仓库中。战略决策可使用按月或周更新的数据,但以这种频率更新的数据是无法支持战术决策的。此时,查询响应时间必须以秒为单位来衡量,才能满足作业现场的决策需要。
第5阶段:动态性
动态数据仓库在决策支持领域中的角色越重要,企业实现决策自动化的积极性就越高。在人工操作效果不明显时,为了寻求决策的有效性和连续性,企业就会趋向于采取自动决策。在电子商务模式中,面对客户与网站的互动,企业只能选择自动决策。网站中或ATM系统所采用的交互式客户关系管理(CRM)是一个产品供应、定价和内容发送各方面都十分个性化的客户关系优化决策过程。这一复杂的过程在无人介入的情况下自动发生,响应时间以秒或毫秒计。
随着技术的进步,越来越多的决策由事件触发,然后自动发生。例如,零售业正面临电子货架标签的技术突破。该技术的出现废除了原先沿用已久、通过手工更换的老式标签。电子标签可以通过计算机远程控制来改变标价,无需任何手工操作。电子货架标签技术结合动态数据仓库,可以帮助企业按照自己的意愿,实现价格管理自动化;对于库存过大的季节性货物,这两项技术会自动实施降价策略,以便以最低的边际损耗售出最多的存货。降价决策在手工定价时代是一种非常复杂的操作,往往代价高昂,超过了企业的承受能力。带有促销信息和动态定价功能的电子货架标签,为价格管理带来了一个全新的世界。而且,动态数据仓库还允许用户采用事件触发和复杂决策支持功能,以最佳方案逐件货品、逐家店铺作出决策。在CRM环境中,利用动态数据仓库,根据每一位客户的情况做出决策都是可能的。
激烈的竞争形势和日新月异的技术革新推动了决策技术的进步。动态数据仓库可以为整个企业提供信息和决策支持,而不只限于战略决策过程。然而,战术决策支持并不代能替战略决策支持。确切地说,动态数据仓库同时支持这两种方式。有了第4和第5阶段数据仓库的营运导向和事件触发决策支持,我们在第1~3阶段按照传统数据仓库分析而特别开发的战略就能够得以执行。
结论
动态数据仓库的应用是一个逐渐演进的过程。
我们并不主张从第1阶段直接跳到第5阶段。有效的风险管理应当基于整合形成的单一数据源的传统数据仓库应用。当数据仓库进步到具有战略决策支持功能时,必然会提出战术决策的更高要求。动态数据仓库如果能用于整个企业,其商业价值会大大增加。向整个企业中成千上万决策者(甚至通过CRM的应用,客户也可参与决策)提供信息,将给企业的业务发展带来巨大的优势。不过,这将要求更先进的数据仓库建造方案。一个可扩展、高性能、高可用性和快速数据更新能力等各方面都能达到顶级服务水平的数据仓库已经离我们不远了。

你可能感兴趣的:(动态数据仓库发展演变的五个阶段)