2009年十大新兴企业技术:MapReduce折桂

对于《InfoWorld》来说,我们的一个任务就是从这个噪音中提取信号,从重要的东西中分离出对IT专业人员有重要价值的东西。我 们都知道嗡嗡声是什么:是噪音。对于《InfoWorld》来说,我们的一个任务就是从这个噪音中提取信号,从重要的东西中分离出对IT专业人员有重要价 值的东西。这是我们在评选2009年十大新兴企业技术的主旨。我们相信,对于IT行业来说,这次评选是一次盛宴,因为我们将评出大量有可能降低成本、改变 我们 工作模式、开拓新领域的新技术。评选中,我们决定摒弃分析师们所鼓吹的高层次发展趋势,而是问我们自己:正在被交付,但是还没有被大范围采用的企业技术 中,哪些技术将会产生巨大影响?

坦白的说,从众多候选技术中选出仅十个技术并不容易,尤其是在我们在今年9月份公布提名后收到许多见解精辟的意见后。以下是我们评选出来的2009年十大新兴企业级技术:

10.白名单(Whitelisting)

跟上恶意软件特征已经不可能了。比如,赛门铁克在2008年一年推出的反病毒特征已经超过了该公司在过去17年所推出的总和。如今,不仅病毒、蠕 虫、木马越来越多,而且有能力变种规避特征对比侦测或使用密码对自身进行加壳的病毒数据也在增长。对于不断增长,设计复杂的恶意软件,白名单可能是唯一的 解决办法。

白名单与一个干净无恶意软件的台式机或服务器镜像启动。白名单软件将对那些用一个或多个用密码编写的文件进行识别。然后,管理系统中的监控代理标示 任何未在哈希表(HashList)中的执行文件或阻止它们运行。大部分公司会分发跨企业的标准系统镜像,所以白名单是一个最有效的确保安全的办法。

白名单需要进行一个文件转变。在当今许多企业中,用户仍然有许多办法控制在他们的台式机或笔记本电脑上运行的内容。但是由于更加复杂的新恶意软件急 剧增长,利用恶意软件实施攻击的有组织犯罪案件数量也在增长,在企业安全领域中,白名单可能将是我们战胜恶意软件的唯一的希望。

9.跨平台移动应用开发

近几年来,移动设备上的企业应用一直没有得到很好地普及,主要有两个原因,一个是因为开发者需要耗费大量的时间去学习如何为智能设备编程,另外是因 为不同设备间的应用移植性不好。这也是为什么InfoWorld认为“跨平台移动应用开发”是2009年新兴企业技术的主要原因:

跨平台移动应用开发环境,比如Rhomobile的Rhodes框架,可以让开发者写一次应用,但能在多个不同的设备上运行,如iPhone、Windows Mobile和BlackBerry等,提供了很多很炫的功能。

对于企业来说,跨平台应用开发可大力促进研发和部署行动应用。你不可能让每位雇员都使用相同的智能手机,即使你做到了,针对特定平台的应用也让你局 在了一个平台上。通过跨平台应用开发,你在开发应用程序时,将可以不用再针对特定平台进行研究,所开发的应用也可以在许多设备上运行。未来,广泛部署移动 企业应用将成为现实。

8. 节能硬件

我们都知道“两种绿色”的内容是:通过降低能源消耗保护地球和节省资金。实现这两个目标的技术已经找到了进行服务器、台式机和其它硬件的方法,但是在一些情况下,只有出现更好的软件支持才会出现效益。

更有效的电源适配器和在不需要时能够自动降低速度或关闭的硬盘正在被广泛应用。要想让不活动的内核、主板或其它部件睡眠,多核CPU通常需要在操作系统或应用层级被告之。

电源适配器是最简单的节能办法。它们不需要软件支持,就可以实现上述两个目标。在AC-to-DC转换过程中,它们几乎不浪费电能,几乎不产生热量 —这也降低了冷却所需的电力。80 Plus认证项目鼓励生产厂商生产转换效率至少达80%的电源适配器。此前,老的电源适配器的转换效率只有50%,也就是说只有一半的电力被传输到了主板 上,另外50%的电能变成了热能。多家存储厂商也开始生产能够在不使用时降低转速或关闭的硬盘。最新的CPU、主板和网卡等硬件也开始引入节能概念。

7.多核芯片

主要的处理器厂商在时钟频率上撞到了墙。处理器时钟频率的每一次增加带来的都是电能的大量消耗,任何一次性能的提升,随之而来的是大功耗和高热量。

有鉴于此,处理器厂商从单线程转向了多线程,随后又从单一快速核设计转向了多个虽然速度较慢但是可并行执行代码的多核。时钟频率已经不再是制约计算的瓶颈,取而代之的是吞吐量。

多核芯片耗电量低,发热量小,工作效率更高。在服务器领域,他们正是IT人员梦寐以求的芯片。

6.固态硬盘

虽然固态硬盘在上个世纪就已经出现,但是最近才开始推出大量新产品,并且价格也大幅下降。在过去,固态硬盘主要用于那些需要尽可能高性能的应用程 序。如今,固态硬盘已经被广泛应用,如使用固态硬盘做为外部缓存以提高应用程序的性能。与传统机械硬盘相比,固态硬盘的价格仍然偏高,但是与添加服务器内 存条相比,它们还是便宜多了。

与传统机械硬盘相比,固态硬盘不仅读写速度更快,而且支持更高的传输速率,更为省电。不足的是,固态硬盘的寿命较短,因为固态硬盘中的每一个单元的写入次数有限。

5. NoSQL数据库

数据正前所未有的流向每个角落。“SQL”与“数据库”可以互换的日子正在快速消逝,部分原因是老式关系型数据库无法处理来自Web 2.0应用的大量数据。

对于NoSQL数据库这个概念,在刚提出时就遇到了很大的挑战,因为目前几乎所有的大型应用采用的都是关系型数据库,或者说SQL数据库。 NoSQL的推出,无异于一场革命。NoSQL数据库对于那些如安全日志或者系统日志等结构化不强的数据而言,使用起来很顺手。另外,因为缺少对数据的控 制,NoSQL数据库处理数据的速度也很快。

4. I/O 虚拟化

I/O虚拟化解决了运行诸如Vmware、微软Hyper-V等虚拟化软件的服务器所出现的问题。当大量的虚拟机在一个单一服务器上运行时,I/O 将成为一个重要的制约VM与网络通信以及VM联接后端存储的瓶颈。I/O虚拟化不仅可以在一个单一服务器上更加容易的在跨多VM分配带宽,它还为动态管理 物理服务器池和存储池找到了一个解决方案。

3.重复数据删除

数据是所有公司的血液。问题是如何处理这些数据。据IDC观察,企业的数据每18个月就会翻一倍,直至存储系统崩溃。导致这一问题的原因经常是因为 要遵守公司保存信息与文件的规定。更为重要的是这些数据在商业价值方面都没有有效期。对多年前的数据进行分析可以帮助用户把握发展趋势,预见未来,预测客 户的行为等等。

为此,我们必须要找到一种可以降低数据存储量,又无需牺牲有用数据。在这里我们要感谢重复数据删除。

2.桌面虚拟化

桌面虚拟化已经出现在了我们身边。你可能会说,桌面虚拟化在上世纪九十年代中期就已经出现。不过,今天的桌面虚拟化已经从我们大多数人在两年前或三前年所想象的有很大区别。另一个里程碑是:新技术以桌面管理程序形式出现。

1. MapReduce

MapReduce是Google在2004年提出的一个软件架构,主要用于大规模数据集的并行运算,它通过把对数据集的大规模操作,将其分发给网 路上的每个节点实现可靠性。在Google内部,MapReduce得到广泛的应用,比如分布排序、Web连接图反转和Web访问日志分析等。提到为什么 将MapReduce放在第一位,InfoWorld解释说:

某种程度上来说,这是考虑到MapReduce的独特创新,它使得从前只能在大型商业硬件上所做的事情,在普通的PC机上即可操作——处理千兆级别 的数据。在亚马逊的Amazon Elastic MapReduce产品中,以Web服务的方式很好地应用了MapReduce的实现——Apache Hadoop。而且,MapReduce还被集成进一些来自IBM、Oracle等公司的主流解决方案,现在它们云计算所用的服务器中可能就跑着 MapReduce。

你可能感兴趣的:(mapreduce)