Haoop集群为何不使用RAID?

 前言: 工作之余,我会多去了解下大数据等相关技术,看得多用的少,搞的挺尴尬。

或许我该再换一份工作,再说吧。过去的就让它随风而去,日后我要把自己在工作中

遇到的或者自己觉得不错的东西给总结起来,一周两篇博客。或好或坏,就当是不断

鞭策自己,不至于在大数据的背景下太落伍。废话不多说,步入主题。


Hadoop集群服务器为何不使用RAID?


       RAID技术主要包含RAID 0~RAID 50等数个规范,它们的侧重点各不相同这里就不多

介绍,感兴趣的可以百度下,这里就不多做介绍。直接说下为什么集群不用Raid:


1.HDFS所提供的节点间复制技术已经满足了数据备份需求,无需使用Raid的冗余机制


2.尽管Raid条带化技术被广泛用于提升性能,但是其速度仍然比HDFS的JBOD慢,Raid
  的读写操作受限于磁盘阵列中最慢盘片的速度,而JBOD得磁盘操作均独立,因而平
  均读写速度高于最慢盘片的读写速度。


3.如果JBOD配置的某一磁盘出现故障,HDFS还可以忽略该磁盘,继续工作。相比之下,
  raid的某一盘片故障会导致整个磁盘阵列不可用。


       另,尽管Hadoop的主体用Java语言写成,但部分代码(例如控制脚本)需要再Unix环境
下执行,因而Hadoop并不适宜在非UNIX平台上提供生产。



你可能感兴趣的:(hadoop,集群,hdfs,raid,HADOOP集群)