曙光大数据存储布局初定

2012年底,曙光做了一次大规模的存储巡展,这让曙光的新老客户以及渠道合作伙伴对曙光存储解决方案的完整性以及存储策略有了全新的认识。在继续巩固核心的政府、教育市场的基础上,曙光存储将向更广阔的行业市场迈进,比如一直由国外存储厂商把持的金融、电信等行业将成为曙光存储新的突破口,尤其是在金融监控以及电信的一些外围非核心应用方面。曙光信息产业股份有限公司产品中心存储产品总监惠润海表示:“曙光存储是面向未来做事情。从产品和研发布局来看,海量数据存储、云存储以及大数据挖掘是我们的业务重点。”
大数据业务值得期待
在云计算方面,曙光多年的努力已经看到了成效。在曙光自己建设和运维的云数据中心里,存储容量基本都超过10PB,承载了大量来自地质勘探、视频监控、电子政务等方面的数据。其中,结构化数据与非结构化数据的存储比例是1∶4,大量非结构化数据存储主要存储的是图片和视频,这也为下一步的数据挖掘奠定了基础。曙光为企业级客户提供的云存储解决方案涉及公安云、税务云、教育云、医疗云等。
在大数据产品方面,曙光已经成竹在胸。针对结构化、非结构化和半结构化数据,曙光都能提供匹配的存储解决方案。比如,针对非结构化和半结构化数据,曙光的ParaStor就是一个非常好的存储平台。再比如,曙光利用自己的文件系统对Hadoop平台进行了优化,可以更好地发挥Hadoop的优势。惠润海表示:“当前,虽然大数据带来的直接收入并不如预期,但是大数据市场的前景十分广阔。”
不赶一体机的时髦
在大数据市场上,一体机越来越流行,曙光却一直按兵不动。“我们一定要透过现象看本质。一体机的核心还是软件。”惠润海表示,“将相关硬件拼凑在一起,再加上Hadoop就能构成一个简单的一体机,但是这样的产品会有竞争力吗?我们只要推出一个新产品,就希望这个产品具有一定的竞争力,能够在市场上取得较高的占有率,而不是搞噱头。”
在大数据业务方面,曙光的核心竞争力主要体现在它有一支强大的技术服务团队,可以为用户提供代码级开发的服务能力。由于自身的复杂性以及存在Bug,Hadoop通常不能直接使用,这就需要大数据解决方案厂商在Hadoop平台上进行相关调整和优化。“由于数据种类繁多,数据量又大,如何快速将大数据导入到大数据挖掘系统中是一个难题。如果厂商没有过硬的技术服务团队,不能根据数据的情况对解决方案进行调整和优化,那么大数据应用落地就将成为一句空话。大数据应用之所以难普及,一个重要的原因就是具有代码级开发能力的专业技术人才太少了。”惠润海表示。
在推广大数据解决方案时,曙光并没有与某一个应用软件厂商签定产品捆绑协议。不过,曙光还是针对一些主流的应用软件进行了方案的优化。举例来说,在结构化数据处理方面,曙光主要针对Oracle数据库进行了方案优化。曙光利用基础的硬件,结合自己的大数据挖掘系统,可以将Oracle数据库的查询速度至少提升50倍,而成本只有传统的“小型机+高端存储”解决方案的十分之一。
存储服务器已获认可
软件定义的网络也好,软件定义的存储也罢,无非都是在强调一个重点:软件将成为未来IT架构和应用的核心。“从存储的研发上看,除了少量的硬件研发以外,我们90%的研发人员从事的都是软件研发。”惠润海表示,“曙光在软件研发上强调的是精英文化,近百人的研发团队具有代码级的开发实力。未来,我们研发的重点将放在海量存储、大数据挖掘和云存储上,而对于传统的磁盘阵列不会有太大的研发投入。”
服务器与存储的融合已经是一个不争的事实。惠润海认为,这种融合带来的改变并不是简单的服务器与存储在应用中的角色转换,或是一体化产品的流行,其最大的变化在于服务器与存储在硬件架构上越来越相似,而两者最关键的区别体现在软件上。现在,越来越多的存储会采用x86架构。几年前,曙光就推出了存储服务器产品,而且销量非常高。
“许多大数据挖掘以及海量存储应用都是基于存储服务器产品构建的。Hadoop的最佳承载平台就是存储服务器架构。”惠润海举例说,“2012年,百度就从曙光采购了大量存储服务器。许多大型互联网公司很少用到传统的磁盘阵列,大部分都是采用2U、24盘位或2U、36盘位的存储服务器。”

你可能感兴趣的:(大数据,存储,曙光)