MapR 让 Hadoop 跑得更快

 

     MapR 创造性的使用了更多的大数据分析方法,使得对数据的处理更快了。MapR的专利,无锁储存服务提供了一个分布式读写层,它主要解决了本地文件系统限制、java问题、和单name node节点 引起的限制的问题。MapR极大的提高了MapReduce的吞吐量。底层的存储服务提供了优化的shuffle操作,使得性能提升。为了全面提升性能,MapR在随机IO方面也表现优异,比其他的hadoop版本快得多。

 

 

 

MapR 特性主要包括 include:

  • 使用其他版本一半的硬件,就能比人家快。

  • 更高的MapReduce和HBase的吞吐量。

  • 优化过的shuffle

  • 更高的随机读写(5倍 到 10倍)

  • 自动透明的压缩机制降低了网络数据传输和硬盘读写。

  • 无锁的架构使得性能的提升和机器的数量呈线性关系。

你可能感兴趣的:(hadoop)