数据仓库中几种最流行产品比较(zz)

前言

数据仓库将是中国未来几年IT行业的明星,其发展将是无法估量的,本文将从DBETL、前端展现工具方面对数据仓库的流行产品进行一些简单的探讨,以供大家参考。

数据库(DB

后台数据库目前比较流行的包括TeraDataNCR)、IQ(Sybase)ORACLEDB2等,而就本人的理解,ORACLEDB2OLTP中占有绝对的优势,但在注重海量数据高效查询的OLAP中,远远不及TeraDataIQ,故本文仅对TeraDataIQ进行比较与讨论。

1.         查询效率

经过严格的测试,总体上来讲是IQ比较快,因为IQ所有的卖点就是“无处不索引”;但TeraData有一个主索引的概念,当按照主索引进行查询时,效率会比IQ高,但若不是按照主索引进行查询讲比较慢,没有IQ的效率高。

2.         兼容性

兼容性方面就没法说了,TeraData只认自己公司的产品,从软件到硬件,其他都使用不成,比如说备份用的磁带都必须是专用,而IQ可以使用在目前所有流行产品上(如IBMSUN等等),不存在兼容性的问题。

3.         价格

对于数据仓库这种项目来讲,投资一般都比较大的,基本上都在千万级别,最小的也要好几百万,故而一般的公司都投资不起,就目前来看,在我国也就电信行业、银行、能源、铁路、民航等少数几家比较有实力的公司才能投资起,但随着这些公司投资的日渐成熟,都不会像以前哪样随便砸钱了,所以价格因素是一个很重要的方面。从投资上来看,当然是IQ便宜的多,TeraData的价格就相当贵了,比方就是一个备份磁带由于是专用而非常贵,其一个节点的价格就相当高,随便也要好几百万。

4.         扩展性

扩展性当然是TeraData比较好,而且效率随着硬件的扩展将得到提高;但IQ也不是说扩展性不好,只是说它的扩展没有TeraData那么方便快捷;但TeraData一个节点只能带4TGB的磁阵,当没有空间时只好扩节点而不是简单的增加磁阵。

5.         数据库管理台

不知Sybase公司是怎么回事,其对数据库管理台的开发相当差,没法和TeraData比了,当然就更没法和ORACLE比了。

6.         磁阵空间利用

IQ的压缩比是所有数据库中最好的一个,好几百兆的数据被压缩进入数据库后就只是占用一点而已;而TeraData是对空间最浪费的一个,这个可能与NCR公司销售策略有关吧,当空间使用完了,你只好买节点,哪可是大把的钱。

总之,就我使用此两个数据库的感受是IQ要在多个方面超越TeraData,如果给两种数据库打分的话,IQ应该在80分,而TeraData最多就60分。

ETL工具

ETL工具最好的应该是Informatica PowerCenterIBM Data Stage两种,从目前本人使用的情况,其他厂商的产品距离这两种产品差距实在是不小。

1.         简易性

从使用的简易性方面看,这两种产品都很不错,如果实在要他们中选择一个更加优秀的,哪我就推举PowerCenter

2.         效率

两个产品的效率都比较高,经测试发现Data Stage在处理DB2Informix时要更快,可能是自己公司的产品吧。

3.         价格

一般来讲,ETL工具的价格都非常高,但是Informatica PowerCenter的价格更加高的离谱,是按照连接数据库的价格来购买,如连接ORACLE数据库是多少钱,DB2是多少钱。

4.         服务

两个产品的技术支持都不算太好,相对而言Data Stage要稍微好些,但PowerCenter使用的人相对要多点,可以在网上找到许多高人的指点。

综上,这两种产品都非常优秀,其他公司的产品在他们面前就好像幼儿园的小朋友,故选择他们中任何一种都是正确的。

前端展现工具

前端展现工具现在非常多,有国外的也有国产的产品,从目前市场的占有率及使用情况来分析,本文就讨论BOCOGNOS两种产品。

1.         语义层

对于语义层定义来讲,这是BO最擅长的地方,其他公司的产品很少有它那么全面的定义内容,据相关报告,说语义层定义是BO的专利,其他公司都是购买它的专利而已。

2.         报表制作

报表制作过程中BO最容易处理,像COGNOS若报表有问题需要修改,哪是相当麻烦的,而且处理一遍很慢(大数据量)。

3.         美观

这方面COGNOS的表现要远远大于BOBO的界面是相当死板,而且二次开发也不是那么容易。

4.         效率

由于COGNOS采用了不同的存储机制,当进行大数据量报表查询时,要比BO的表现好些。

5.         价格

两种产品的价格都不菲,但BO更贵一点而已。

综上,BOCOGNOS都表现的非常优秀,但本人认为BO更好一点而已,虽然界面不美观。

结论

若要进行数据仓库的建设,在考虑投资、性价比、支持等方面考虑,本人的建议是,采用如下配置好像既能保护好投资,也能够很好使项目得到顺利实施,即IQ+PowerCenter+BO。尤其是要慎重使用NCR的产品,最直接的原因就是无法和其他公司的产品兼容,一旦使用将无法摆脱它的束缚,而且性价比也不高。

(转自:http://hi.baidu.com/sunning_cho/blog/item/f982a40652a8567c020881b4.html)

你可能感兴趣的:(科普)