坐在T61前盯着屏幕啪啪敲击键盘的时候,我们很难想象仅仅在50年前人们还是用高考答题卡那样的东西来管理数据。那时的数据管理是通过把一张张穿孔卡片进行物理的储存和处理进行的,譬如IBM的前身CTR公司即靠这种产品发家致富,迎来了IT事业的春天。
而当前网站的后台,就拥有无限的数据进行交互。即使是如同逐浪CMS这样的通用网站内核系统,每天也通过微软公司的SQL Server和甲骨文公司的Oracle数据库进行丰富的交互,引导信息时代的发展。
与今天动辄上百TB的磁盘阵列和光纤通道相比,数据库技术发展的速度简直是直接乘上了时光机,数据库这一隐藏在幕后的核心软件技术的演进改变着整个社会的发展进程。直到今天,从机票预定、领取工资到网络购物、天气预报,人类社会的生活已离不开这个“库”——没有内裤无非裸奔,没有小金库无非惧内,没有数据库的现代社会则变成一个失忆的人,前无历史后无未来,今日无法领工资。
言归正传,话说今天各位能够看到月球表面的照片,那还多亏了IMS (Information Management System,信息管理系统)。 IMS,一个至今仍然活跃于大型关键商业应用领域的数据库软件,是IBM开发的最为典型的层次数据库,当时被用于帮助NASA管理宏大的阿波罗计划中的繁琐资料,并于1970年成功协助阿波罗13号执行了第一次人类登月计划。
回顾数据库的历史,数据库(Database)自20世纪60年代诞生以来,经历了网状数据库、层次数据库、关系数据库等按数据模型特点发展的不同阶段。从IBM发布数据管理三剑客(IMS、CICS、GIS),到IBM成立System R团队与竞争对手抗衡,催生了今天的关系型数据库,而今天的另一家数据库软件大鳄Oracle公司当时甚至在IBM之前就发布了基于System R和SEQUEL成果的商用关系型数据库系统,奠定了其在全球数据库市场的地位。
20世纪80年代以后,个人电脑的诞生进一步刺激了关系型数据库的增长,到80年代中期,医药、多媒体等行业开始面临非结构化数据的管理问题;90年代数据库客户开发工具、面向个人用户和中小企业的数据库软件以及数据挖掘等技术开始成为竞争的焦点;90年代中后期,主要数据库供应商开始向互联网转型,同时,开源软件开始崭露头角。
DB2 是什么兔
尽管被Oracle抢得先机,IBM并未就此灰心。System R项目的成果转化为了一款令IBM在数据库领域东山再起、重振雄风并在此后数十年里经久不衰的著名品牌——DB2。发布之初,这款全称为Database 2 for MVS的“兔子”就令用户惊喜的发现,其开发和部署应用程序的速度比以前快了5倍。
为了完善这个显露了无限市场的产品,IBM的研发人员不断地朝着使之降低硬件成本的方向发起冲击。1989 年,当DB2的版本升至V2.1的时候,终于使处理器的成本降低到了层次型数据库系统的15%。这之后,DB2销售一路飙升。1996年IBM将DB2更名为 DB2 通用数据库(DB2 Universal Database),这是第一个能够对多媒体和 Web 进行支持的关系型数据库管理系统。2001年IBM 以10亿美金收购Informix数据库业务。这次收购扩大了 IBM 的分布式数据库业务。2003年,在DB2诞生二十周年之际,IBM将其原来的数据库产品线DB2品牌更名为IM信息管理(Information Management)。 同年7月IBM推出的DB2 II,2006年,IBM发布DB2 9版本,将数据库领域带入XML时代,这是业内第一个同时支持关系型数据和XML数据的混合数据库。
风风雨雨二十六年,DB2长盛不衰。今年9月DB2推出最新版本DB2 9.7软件,新产品代号为“Cobra”,即“眼镜蛇”,其优势是可大幅减少数据存储空间,帮助客户节约高达75%的相关成本。该软件还是首款能够同时为关系型数据和XML数据提供业务分析功能的数据库软件,并嵌入了开源数据库厂商EnterpriseDB的兼容性技术,实现了与Oracle数据库的兼容。
看一个软件公司的成败,不只是看它能够提供哪些产品,很多时候同类产品的功能差别并不是很大,重要的是看软件供应商把自己的资源和精力主要放在哪些方面,要看其产品的未来发展方向。IBM就是这样一个公司。以信息管理品牌为例,数据库最早只是管理结构化数据,虽然后来关系数据库也提供管理非结构化数据的能力,不过对非结构化数据的管理更多的是放在内容管理系统中。而当数据被管理起来之后,对于数据的分析利用自然成为数据管理领域的重点,因此商业智能热度飞升。当IBM DB2在提供内容管理和商业智能功能的时候,都是在IBM DB2通用数据库的周围进行不断扩展。IBM自己也认为,今天的DB2已经不再只是一个数据库,而是成为IBM数据管理领域的一个重要核心存在。
面向商业智能应用是DB2的另一个重要发展方向,IBM继续投资加强DB2的分析功能。DB2的第二项投资将用于自主功能(自主调解和自动配置),自主功能在BI应用中至关重要。在BI应用中,新的数据必须能够随时进入数据仓库或数据集市,因为数据处于动态变化中。随用户访问集中度和频率的变化,BI的工作负载也是动态变化的。BI的基础平台必需具备很好的弹性,能够有效应对数据量和工作负载的动态变化。IBM信息管理平台为用户提供了一个完整的基础设施。
商业智能有多“能”
我想看曾哥被淘汰的现场视频,可是搜索这几个关键字只能得到“抱歉,未返回任何结果”;我想从销售部门成捆的报告和浩如烟海的电子邮件里寻找几个客户的售后处理结果可是忘了具体时间,IT部门认为没戏,因为这些销售报告和电子邮件是那么“文采各异”,无法在数据库中分析;我想知道在线阅读《IT客》的客户有多少在考虑服务器升级……
信息爆炸的今天每个人都面临着信息难以取舍、管理和利用的问题,无论是企业管理者还是普通白领,都会遇到类似的麻烦。有价值的信息越多,对数据管理能力的要求就越高。商业智能(BI,Business Intelligence)是近几年才慢慢得到用户应用的技术,通过对数据的收集、管理、分析以及转化,使数据成为可用的信息,从而获得必要的洞察力和理解力,更好地辅助决策和指导行动。
说到商业智能这个词,很容易会想到一个问题——“计算机的智能和人的智能是一个概念吗?”这就要谈到商业智能的缘起:20世纪50年代卡内基理工学院、麻省理工学院和斯坦福大学的一帮著名学者对组织行为以及人脑机能有着共同兴趣,他们建立了早期的人类认知计算机模型——人工智能的雏形。当时研究人工智能的两个目的就是一方面帮助研究人员了解大脑的决策机制,另一方面为了提高人们在组织中的决策质量。在其后的几十年中,从单独的分析决策系统到信息中心、IBM开创的数据仓库技术、直到1989年“商业智能”的正式提出,用以描述运用复杂决策分析来改善绩效的一整套方法。商业智能的最初构想就是计算机技术应用向更接近人脑分析功能的方向迈进,在这个故事里,技术为梦想插上了翅膀。
商业智能到底能做什么事?还是让我们举一个真实案例来说明吧:“动感地带”是中国移动通信为年轻人度身定制的产品品牌,平民化的价格是其品牌优势,譬如推出20元发300条短信的资费套餐。但是推出之后销售部门困惑地发现,很多年轻人并没有选择这个便宜的资费套餐。这是一个营销部门经常会遇到的问题类型。要想知道消费者的真实想法,答案其实蕴含在用户巨大的数据库宝藏中——这就到了商业智能施展身手的时候!
通过分析,移动公司发现很多购买了动感地带套餐的年轻人每月发不完300条短信,很多年轻人觉得套餐不值,通过统计,他们得出了这部分年轻人占有的比例。为了制定更灵活的动感地带套餐留住这些用户,移动公司需要对营销方式进行调整——推出10元动感地带套餐业务,但是短信套餐到底是150条还是180条合适呢?在出台新的套餐时,移动公司通过数据挖掘来作为决策的依据,并通过商业智能对预期的收益进行了预测。10元套餐推出后,尽管对于单个用户资费减少了,但使用的年轻人增加了,总体收益呈上升的趋势,符合预期的收益。这就是商业智能的能耐——用数据来帮你做决策。
数据挖掘和数据仓库这样的商业智能技术之所以受到企业的重视,就是因为它能大大提高企业在数字时代的决策质量。无论是金融服务领域、医疗保健机构或是零售业,还是政府公共安全领域,都把对数字信息进行深度分析的方法应用于各种活动,从而在各自的领域有效规避风险,并获得强大竞争力。
“生活就是你所作的选择的总和。”任何企业的成功或失败都是由大大小小的决策累积而成的。一个“高智商”企业、一个分析型竞争者可以从业务流程中挤出全部的价值。航空公司的订票系统或是网络购物推荐系统能够凭借商业智能的应用极大提高销售收入和企业声誉,恰恰说明在新的数字时代数据库技术已从一种支持性工具变成了一种战略性武器。
今天数据资产已经成为互联网时代企业最为宝贵的“数字资产”,而“商业智能”成为数据库技术最耀眼的成就,从销售预测到产品定价,从追踪预防犯罪到制定法律法规,商业智能正成为信息社会企业决策的第二大脑。