什么是磁碟阵列

额外的储存设备 iSCSI 协定的磁碟阵列:
常常会听到所谓的 SAN ( Storage Area Networks ) 与 NAS ( Network Attached Storage ) 这两个字眼, NAS 主要是以一部专门给储存资料用的主机,以现有的 TCP/IP 协定来提供作为类似 file server 的用途, 他可以直接放置在网路上面,提供使用者存取资料之用。SAN 则类似一部储存设备, 藉由光纤通道提供某几部主机进行资料的存取之用,价格昂贵,维护成本高,但是储存效能佳! 但不论是哪一种架构,基本上,他们的储存硬碟通常是以磁碟阵列 (RAID) 作为基础的。 底下我们会来谈一谈什么是磁碟阵列,并同时以目前较新的 iSCSI 架构的储存设备来进行一个简单的网路储存设备架设。

什么是磁碟阵列
磁碟阵列全名是『 Redundant Arrays of Inexpensive Disks 』,简写为 RAID, 他是透过一个技术(软体或硬体),将多个较小的磁碟整合成为一个较大的磁碟装置; 而这个较大的磁碟功能可不止是储存而已,他还保有资料保护的功能呢。 整个 RAID 由於选择的等级 (level) 不同,而使得整合后的磁碟具有不同的功能, 基本常见的 level 有这几种:
Linear mode (线性模式):
两个以上的磁碟整合成为一个实体的储存装置;这个模式的特色是, 所有的资料是『一个一个填满后,才将资料继续写到下一个磁碟上』; 由於资料是一个一个写入到不同的硬碟当中,因此,整个磁碟的读取效能并不会增加, 此外,由於资料具有连续性,因此,若不小心有任何一个磁碟损毁时,嘿嘿! 您的资料可能通通救不回来了~这种模式唯一的好处, 就是磁碟的空间完整的被利用完毕!不会有任何保留空间 (redundant)。
RAID-0 (交错模式, stripe):
这种模式主要是利用容量相同的磁碟来达成,效能会比较好。 所谓的交错 (stripe) 是因为档案资料是同步洒到不同的磁碟上头去的意思, 也就是说,假设我有两颗磁碟设定成 RAID-0 ,那么当我有 100MB 资料要写入时, 则 100MB 会被拆成两个 50MB 分别写入不同的磁碟上头去!

所以罗,因为每一个磁碟写入的资料量只有一半,因此,读写的效能都会大大的增加! 而且越多颗磁碟所造成的 RAID-0 装置,理论上,效能增加的越明显。 但是这种模式有个最大的问题,那就是,因为一笔资料被拆成几个部分分布在不同的磁碟上头, 因此『任何一颗磁碟的损毁,都会让你的资料救不回来!』

另外,如果使用不同容量的磁碟来达成 RAID-0 时,则在储存资料长大到一定程度时, RAID-0 的效能会变差。假设我用了一颗 20GB 两颗 16GB 的硬碟好了, 那么当总资料量少於 48GB (16x3) 时,效能是很不错的。 但是当超过 48GB 时,则资料仅能储存在 20GB 那一颗了 (可用容量剩下 4GB 啊!), 所以罗,当然效能就变差了啊!
RAID-1 (映射模式, mirror):
这种模式也是需要相同的磁碟容量的,最好是一模一样的磁碟啦! 如果是不同容量的磁碟组成 RAID-1 时,那么总容量将以最小的那一颗磁碟为主! 这种模式主要是『让同一份资料,完整的保存在两颗磁碟上头』, 也就是说,如果我有一个 100MB 的档案,且我仅有两颗磁碟组成 RAID-1 时, 那么这两颗磁碟将会同步写入 100MB 到他们的储存空间去, 因此,整体容量几乎少了 50%。由於两颗硬碟内容一模一样,好像镜子映照出来一样, 所以我们也称他为 mirror 模式罗~

我们可以说,这种模式最大的优点大概就是在进行备份吧! 因为所有的资料都被存放在两个磁碟上面,所以,任何一颗磁碟损毁时,嘿嘿! 所有的资料可都还是保存的好好的呢~

至於效能上面,由於要写入的资料变多了,(同步写入两颗硬碟嘛!), 所以,效能会比单颗磁碟还要差一些,没办法,因为我们都是透过同一个汇流排在进行资料的通行啊~ 不过,读取的效能还不错,因为资料有两份,如果多个 processes 在读取同一笔资料时, RAID 会自行取得最佳的读取平衡。

事实上,为了保有 RAID-1 的储存优点,又想要具有类似 RAID-0 的效能增强, 所以,后来也有所谓的 RAID 0+1 ,亦即同时具有 RAID-0 与 RAID-1 的功能; 只是,这样的功能至少需要四颗以上的相同容量的磁碟才行~ 而且总可用容量会减少一半 (因为 RAID-1 啊!)。
RAID-5:
这个类型最有趣~也是目前最常见的一种类型了。 RAID-5 会整合多个磁碟 (通常需要三个以上),然后每部磁碟机上面都会记录少许的其他部磁碟机的资讯 ( parity information ),由於这个动作,因此,实际上可以使用的容量其实是 (N-1)*S ,那个 N 为全部的磁碟机总数,S 则是最小的那个磁碟的容量。 少掉的空间就是用来作为资讯记录用的。

由於这个机制的存在,因此,当那 N 部磁碟机有任何一部出问题时, 他的资料都会被平均记录到其他 N-1 部磁碟机内,所以,只要你将坏掉的那一颗拿掉, 换一颗好的磁碟后,该磁碟原本的内容就会被重建 (rebuild) 起来, 呵呵~很棒的备份效果吧!

除此之外,因应目前所谓的热拔插 RAID 架构,因此,很多的硬体 RAID 在制作这个 RAID-5 的类型时,他会使用 N+1 颗磁碟,其中 N 颗用来作为 RAID-5 之用, 另外那一颗则做为磁碟损坏时的即时处理之用 (spare disk)。 所以,假设您有十颗磁碟在这样的架构下时,则事实上只有九颗在进行 RAID-5 的存取, 一颗作为错误处理,所以总容量应该是 8xS 才对喔!而当有任何一颗磁碟出问题时, 那一颗 spare disk 就派上用场了,他会立刻被重建, 因此,您只要将有问题的磁碟拔掉,换上一颗新的,嘿嘿!搞定!

不过还是要注意啦,因为 RAID-5 仅能处理一颗硬碟坏掉时的处置, 若同时有两颗以上的磁碟损毁,那....所有的资料还是会完蛋的! 所以啦,特重要的资讯还是得要复制出来才行~关於考量,呵呵~请参考备份策略吧!

至於存取效能上面,读取的效能几乎可以媲美 RAID-0 ,但是写入的效能就无法像 RAID-0 那样明显。因为还得要计算分别写入到所有磁碟当中的平衡资讯 (parity information), 所以写入的效能虽然是会增加不少,不过,不容易计算出来实际的增加的效能啦~
呵呵!经过上面的说明,您应该会晓得,为何企业会需要使用磁碟阵列了吧? 没错,因为 RAID 不但可以增加资料存取的效能, 而且对於备份与资料的可靠性而言,他具有相当程度的类似备份的功效,因此, 很适合需要大量存取资料的主机系统。所以罗,目前很多的线上储存设备, 基本上,都是透过 RAID 装置来达成的~底下我们就大略的来介绍一下目前挺流行的 iSCSI 介面的储存设备吧!( 如果对於 Linux 上面的 RAID 有兴趣, 可以参考这一篇:http://www.tldp.org/HOWTO/ Software-RAID-HOWTO-1.html )

iSCSI 磁碟阵列的架设与使用
由於企业的资料量越来越大,而且重要性与保密性越来越高,尤其类似资料库的内容, 哇!常常容量单位是以 TB (1TB = 1024GB) 在进行计算的;可怕吧! 所以罗,上一个小节内提到的磁碟阵列 (RAID) 的应用就很重要了。 不过, RAID 毕竟只是在一部主机上面的储存装置,如果想要提供给网路上面的其他 client 端来使用,可能还需要主机提供相关的服务才行啊!而且,透过网路主机来连接, 效能上可能是卡在网路传输速度,而不是 RAID 的速度说。而且, RAID 装在一部主机上面时, 能够提供给 client 端使用的情况有限啦~大多仅是资料而已。
NAS
为了解决网路应用上面的,很多厂商提供了一些不错的想法。首先,就是那个 NAS (Network Attach Storage),基本上, NAS 其实就是一部客制化好的主机了, 只要将 NAS 连接上网路,那么在网路上面的其他主机就能够存取 NAS 上头的资料了。 简单的说,NAS 就是一部 file server (档案伺服器) 罗~ 不过, NAS 由於也是接在网路上面,所以,如果网路上有某个 client 大量存取 NAS 上头的资料时, 是很容易造成网路停顿的问题的,这个比较麻烦点~
Tips:
在鸟哥的理解当中, NAS 基本上就是一部完整的主机, 他有独立的作业系统与运算、储存等处理单元,其他的 client 端只要能够与 NAS 的协定相容,那么他就能够存取 NAS 上头的资料啊!

SAN
我们需要大量的存取装置,目的就是为了要强化存取效能与总可用容量,现在知道总可用容量可以使用 RAID 技术来加强,但是存取效能呢?透过网路来存取时,确实可能导致存取效能的低落啊。 为了解决这个问题,因此后来很多厂商开发出所谓的光纤通道。光纤通道的速度要快上很多, 目前标准的光纤通道是 2GB ,未来还可能到达 10GB 以上呢~ 不过,使用光纤等技术较高的设备,当然就比较贵一些。 利用光纤,配合一些硬体的标准化,后来一些厂商提出了 SAN (Storage Area Network) 架构; SAN 利用较高阶的光纤通道来进行主机与储存设备的连接, 让主机透过光纤来快速存取储存设备内的资料,而不是透过较慢的网路架构。 但是 SAN 架构的初设成本太贵,而且维护费用颇高!
拜乙太网路盛行,加上技术成熟之赐,现今的乙太网路媒体 (网路卡、交换器、路由器等等设备) 已经可以达到 GB 的速度了,离 SAN 的光纤通道速度其实差异已经缩小很多啦~ 那么是否我们可以透过这个 GB 的乙太网路来达到类似 SAN 的功效呢? 没错!这就是我们接下来要提到的 iSCSI 架构啦! ^_^
iSCSI
其实,整个 iSCSI 的架构主要分为储存设备与提供 iSCSI 连线的主机端, 而 iSCSI 则透过乙太网路连结储存设备与主机就是了。 两者的关系有点像底下这个图示:

图一、 iSCSI 的主机与储存设备的关系。

首先,您必须要拥有 iSCSI 介面的储存设备 (废话!不然怎么玩?) , 然后,您的 iSCSI 储存设备上面必须要具有 IP 位址,并且储存设备以网路线连结到拥有 GB 速度的 Switch 上。再来,您的主机必须要启动 iSCSI 的驱动程式, 驱动他之后,他会使用 TCP/IP 的网路协定连结到储存设备上头, 并且『将整个储存设备视为主机上面的一个 SCSI 硬碟』的模样! 也就是说,基本上,iSCSI 的储存设备就是您主
作者: 相思爱文 发布日期: 2009-3-22

本文出自 “宏宏在线” 博客,转载请与作者联系!

你可能感兴趣的:(职场,休闲,什么是磁碟阵列)