Hadoop用来补充而非替代关系型数据库

 
【摘要】随着更多的非结构化的数据流进入企业的舞台,Hadoop的采用开始兴趣。但其日益增长的重要性不是把传统的关系型数据库管理系统(RDBMS)降为垃圾,而是说,基于开源的数据处理框架的额外的分析能力是对这个系统的一种补充,据行业观察者说。

雅虎云平台组的副总裁Hari Vasudev解释说,Hadoop在处理大量结构与非结构数据上是“非常有效的”。它适用于在传统数据仓库中对即时查询需求的支持,但不能取代针对有低潜在因素需求的传统商业智能(BI)功能的关系型数据库管理系统(RDBMS)的部署,Vasudev补充道。

当问到在当今的数据中心环境里,哪里是部署Hadoop的最佳地方时,他说开源框架目前在广阔的业务情境和行业中常被作为一种分析工具。

在进一步的阐述中,他指出,如果一个企业为不能满足高度复杂处理的业务需要,以及大量主要以非结构化数据为主的数据和拥有持续演化或受到挑战的分析,那么该企业就应该发掘采用诸如Hadoop这样的大数据分析的好处,以在更多不利于企业的风险中获得竞争优势。

亚太地区的Frost  Sullivan 公司的信息通信技术(ICT)实践的行业负责人Moaiyad Taher Hoosenally,给出了略微不同的观察角度。该分析师说,随着时间的推移,Hadoop预计将对传统的关系型数据库管理系统(RDBMS)的功能有“某种程度的影响”。

以戴尔目前销售预配置有Hadoop的服务器为例,他指出到其他IT供应商将开始直接在功能中提供这样的大数据分析的能力。

Hoosenally补充说,Hadoop起初将最适用于银行和金融服务、公用工程和通讯的垂直行业,但他表示,随着时间的推移这一技术将被所有其他行业部门所接受。

微软亚太地区的平台策略的领导Chris Levanes,同意并说来自开源软件社区的Hadoop和其它项目“为早期采用者提供了一套引人注目的大数据工具集”。

Levanes指出,这一类的产品尚处于初期,而且许多供应商、开发人员和研究者继续致力于在他们各自的项目上利用这一技术。他补充说,微软相信大数据在未来将进入主流,而微软正投资和参与到这个区域中的很多项目中来。

这样的行动方案中的一个Daytona项目,他将该项目说成是一种“简单的、易于使用的界面,让开发者在不必懂太多关于分布或Windows Azure的情况下就能编写机器学习和数据分析算法”。

ZDNet在亚洲的姊妹网站CNET早些时候报道说,Daytona的工具可使科学家免于编写自己的软件工具并提供他们集中精力分析最大的数据采集上的能力。

采用上的挑战一直存在

据说,Vasudev曾指出Hadoop的工作量很大,注意到网络是最难确定的变量。“关键是要购买足够的网络容量,让所有节点在集群以合理的速度和合理的成本上互相交流,”他说。

Hoosenally还指出,企业在利用Hadoop上面临着“急剧上升的学习曲线”,而这将使与遗留的IT系统的整合“较为困难”。

更有甚者,当前在如何启动和确保有效使用开源框架上缺乏文档和信息,他补充说。

他又指出,招聘具有该领域专业知识的合适人才是另一种挑战。

互联网数据中心(IDC)亚太区联合副总裁Philip Carter在早先的一份报告中强调了数据人才的缺乏。他举例说,在亚洲的公司对大数据以及IT部门应该如何接近它的理解上层次较低。即使在这个领域有更多知识的IT领导人也不能确定管理信息采集所需技能的种类,该分析师说。

你可能感兴趣的:(数据库,hadoop,数据分析,框架,工具,数据中心)