DAS
DAS是Direct Attached Storage的缩写,即“直接连接存储”,是指将外置存储设备通过连接电缆,直接连接到一台计算机上。采用直接外挂存储方案的服务器结构如同PC机架构,外部数据存储设备采用SCSI技术,或者FC(Fibre Channel)技术,直接挂接在内部总线上的方式,数据存储是整个服务器结构的一部分,在这种情况下往往是数据和操作系统都未分离。DAS这种直连方式,能够解决单台服务器的存储空间扩展、高性能传输需求,并且单台外置存储系统的容量,已经从不到1TB,发展到了2TB,随着大容量硬盘的推出,单台外置存储系统容量还会上升。此外,DAS还可以构成基于磁盘阵列的双机高可用系统,满足数据存储对高可用的要求。从趋势上看,DAS仍然会作为一种存储模式,继续得到应用。DAS 存储方案见下图
直连式存储依赖服务器主机操作系统进行数据的IO读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的磁带机(库),数据备份通常占用服务器主机资源20-30%,因此许多企业用户的日常数据备份常常在深夜或业务系统不繁忙时进行,以免影响正常业务系统的运行。直连式存储的数据量越大,备份和恢复的时间就越长,对服务器硬件的依赖性和影响就越大。
NAS
NAS是英文Network Attached Storage的缩写,通常翻译为网络附加存储。
NAS设备主要用来实现在不同操作系统平台下的文件共享应用,与传统的服务器或DAS存储设备相比,NAS设备的安装、调试、使用和管理非常简单,采用NAS可以节省一定的设备管理与维护费用。NAS设备提供 RJ- 45 接口和单独的IP地址,可以将其直接挂接在主干网的交换机或其它局域网的Hub上,通过简单的设置(如设置机器的IP地址等)就可以在网络即插即用地使用NAS设备,而且进行网络数据在线扩容时也无需停顿,从而保证数据流畅存储。NAS存储方案架构图如下
从趋势上看, TOE(TCP/IP Offload Engine)技术已经逐步成熟,Intel 、 Adaptec公司都已经有了成熟的产品,并将逐步应用在网络适配器上。同时,iSCSI 技术的产品方案也逐步成熟,这两种技术将大大推进NAS的应用。
NAS解决方案通常配置为作为文件服务的设备,由工作站或服务器通过网络协议(如TCP/IP)和应用程序(如网络文件系统NFS或者通用 Internet文件系统CIFS)来进行文件访问。大多数NAS连接在工作站客户机和NAS文件共享设备之间进行。这些连接依赖于企业的网络基础设施来正常运行。
为了提高系统性能和不间断的用户访问,NAS采用了专业化的操作系统用于网络文件的访问,这些操作系统既支持标准的文件访问,也支持相应的网络协议。NAS使文件访问操作更为快捷,并且易于向基础设施增加文件存储容量。因为NAS关注的是文件服务而不是实际文件系统的执行情况,所以NAS设备经常是自包含的,而且相当易于部署。NAS设备与客户机之间主要是进行数据传输。今天在LAN/WAN上传输的大量数据被分成许多小的数据块。传输的处理过程需要占用处理器资源来中断和重新访问数据流。如果数据包的处理占用太多的处理器资源,则在同一服务器上运行的应用程序会受到影响。由于网络拥堵影响NAS的性能,所以,其性能局限性之一是网络传输数据的能力。
NAS存储的可扩展性也受到设备大小的限制。增加另一台设备非常容易,但是要像访问一台机器上的数据那样访问网络环境中的内容并不容易,因为NAS设备通常具有独特的网络标识符。由于上述这些限制,NAS环境中的数据备份不是集中化的,因此仅限于使用直接连接设备(如专用磁带机或磁带库)或者基于网络的策略,在该策略中,设备上的数据通过企业或专用LAN进行备份。
NAS的技术特点
NAS为那些访问和共享大量文件系统数据的企业环境提供了一个高效、性能价格比优异的解决方案。数据的整合减少了管理需求和开销,而集中化的网络文件服务器和存储环境—包括硬件和软件—确保了可靠的数据访问和数据的高可用性。可以说,NAS提供了一个强有力的综合机制。
NAS技术能够满足特定的用户需求。例如当某些企业需要应付快速数据增长的问题,或者是解决相互独立的工作环境所带来的系统限制时,可以采用新一代NAS技术,利用集中化的网络文件访问机制和共享来解决这些问题,从而达到减少系统管理成本,提高数据备份和恢复功能的目的。
NAS的优点
NAS适用于那些需要通过网络将文件数据传送到多台客户机上的用户。NAS设备在数据必须长距离传送的环境中可以很好地发挥作用。此外,NAS设备非常易于部署—可以使NAS主机、客户机和其他设备广泛分布在整个企业的网络环境中。正确地进行配置之后,NAS可以提供可靠的文件级数据整合,因为文件锁定是由设备自身来处理的。尽管其部署非常简单,但是企业仍然要确保在NAS设备的配置过程中提供适当的文件安全级别。
NAS应用于高效的文件共享任务中,例如UNIX中的NFS和Windows NT中的CIFS,其中基于网络的文件级锁定提供了高级并发访问保护的功能。NAS设备可以进行优化,以文件级保护向多台客户机发送文件信息。
在某些情况下,企业可以有限地为数据库应用部署NAS解决方案。这些情况一般只限于以下的应用:大量的数据访问是只读的;数据库很小;要访问的逻辑卷也很少; 所要求的性能也不高。在这些情况下,NAS 解决方案有助于减少用户的总体拥有成本。
NAS和SAN之间的许多原有差别开始消失。例如,NAS设备逐渐采用SAN来解决与存储扩展和备份恢复相关的问题。尽管这两种技术类似,但是NAS不能提供SAN所带来的全面的商业优势。然而,与传统的服务器附加存储相比,不管是SAN还是NAS技术都能减少用户的总体拥有成本,并能提供更好的投资回报。
SAN,是Storage Area Network的缩写,即“存储区域网络”。SAN专注于企业级存储的特有问题。当前企业存储方案所遇到的两个问题是:数据与应用系统紧密结合所产生的结构性限制,以及目前小型计算机系统接口(SCSI)标准的限制。SAN中,存储设备通过专用交换机到一群计算机上。在该网络中提供了多主机连接,允许任何服务器连接到任何存储阵列,让多主机访问存储器和主机间互相访问一样方便,这样不管数据置放在那里,服务器都可直接存取所需的数据。同时,随着存储容量的爆炸性增长,SAN也允许企业独立地增加它们的存储容量。
SAN存储方案
SAN,Storage Area Network,存储区域网络是一个用在应用服务器和存储资源之间的专用的高性能的网络体系,在多台主机和多个存储设备之间提供任意两个结点之间的通信通道。该类网络针对大量存储数据的传输进行了专门的优化,使用的典型协议是SCSI-FCP(SmallComputer System Interface-Fiber Channel Protocol,小型计算机系统接口——光纤通道协议),因此可以把SAN看成是对SCSI协议在长距离应用上的扩展。光纤通道特别适合于存储网络,原因在于一方面它可以传输大块数据(这点类似于SCSI),另一方面它能够实现远距离传输(这点又与SCSI不同)。普通的计算机局域网也能用来连接主机和存储设备,就是NAS。存储区域网是独立于计算机局域网的专用于存储服务的网络,它有不同的协议栈和不同的物理设备。现在大多数的存储区域网都是建立在光纤通道网络之上。
光纤通道SAN的组成结构
光纤通道存储区域网是与计算机局域网完全分开的一个网络。存储区域网连接时用服务器和存储数据的存储设备,应用服务器和存储设备之间通过这个存储网络来交换数据。存储区域网通信系统本身是由光纤或铜缆介质、光纤通道集线器、光纤通道交换机等网络设各组成。
除了光纤通道使用的传输介质即光缆和铜缆外,光纤通道SAN的组成结构包括应用服务器连接卡、存储网络连接设备、存储设备和存储软件。存储架构图如下
服务器连接卡(HBA)
位于应用服务器上与存储网络连接的设备一般称作主机总线适配卡(HBA:HostBus Adapter)。HBA是服务器内部I/O通道与存储系统I/O通道之间的物理连接。最常用的服务器内部I/0通道是PCI和Sun公司的SBus,它们是连接服务器CPU和外围设备的通信协议。常用的存储系统I/0通道是SCSI。在使用光纤通道SAN的情况下,存储系统I/0通道实际上就是光纤通道,而HBA的作用就是实现内部通道协议PCI或Sbus等和光纤通道协议之间的转换。在使用并行SCSI总线的DAS系统中,HBA就是SCSI控制器;而连接光纤通道的HBA也被称作光纤通道卡。
HBA通常在其内部有一个自己的CPU,有一些用作数据缓存的内存,还有连接光纤通道和总线的连接器件。一般由卡上的CPU执行两种协议的转换。HBA还有一些其他的功能,如初始化与光纤通道网络连接的服务器端口,支持SCSI等上层协议。8b/l0b编码解码往往也由HBA实现,HBA覆盖光纤通道从FCO到FC4所有层次。
存储网络连接设备
存储网络设备是连接应用服务器和存储设备的网络设备,包括光纤通道集线器、交换机、桥接器和路由器。
1、光纤通道集线器
仲裁环是SAN中一种比较简单的方式,它最多可以连接126个存储设备和应用服务器。但是这种连接方式在增加和除去其中的一个设备时必须让环上所有的设备都停止工作一段时间。另外,如果一个设各有了故障,整个环都不能正常工作。
使用光纤通道集线器可以解决上述问题。它类似于局域网集线器,所有的设备连接到作为中心的集线器端口上,在集线器内部把它们连接成环,物理拓扑结构看越来是星形,但工作时按照环网的方式运行,所以也被称作星环结构。
光纤通道集线器把各个设备连接成仲裁环,在同一时刻只能有两个设备使用环地信,相当于所有设备共享一个光纤通道的带宽。
2、交换机
光纤通道交换机则不同,当一个设备需要和另一个设备通信时,交换机就在它们之间建立一个通道。如果同时还有另外两个设备需要通信,交换机就为它们再建立一个通道。因此交换机能让任意两个设备都拥有一个光纤通道的带宽。向仲裁环中添加新设备会进一步分割共享的带宽,而在交换机尚未使用的端口上连接新设备却会增加总的带宽。例如,一个拥有4个发起方设备和4个目标方设备的8端口交换网,在2Gbps速率的规格中能够支持4个并行的200MBps的会话,或者说总数为800MBps的吞吐率。
在地址方面,交换网与仲裁环也有差别。交换网并不受限于由传输字的连续不均衡性决定的地址(AL-PA)空间。连接交换网的结点使用24位的端口地址,从理论上讲,有超过1600万个可能的地址。光纤通道交换机产品所提供的端口数量,为从部门级交换机的8端口到更大的 企业级交换机的128个或更多个端口。
SCSI到光纤通道桥接器可以把传统的SCSI设备连接到光纤通道存储网络,并在两种协议之间做转换工作。 存储网络有两种端口,一种是SCSI端口,用于连接SCSI设备;另一种是光纤通道端口,用于连接光纤通道设备。它通常提供一个或两个光纤通道接口,以连接到光纤通道SAN,同时也为SCSI磁盘阵列或磁带备份子系统提供2-4个SCSI端口。这样,连接在光纤通道SAN上的所有应用服务器都可以使用传统的SCSI磁盘阵列或磁带备份子系统,共享原来属于个别服务器专有的存储资源。
3、桥
光纤通道广域网桥接器可以把两个光纤通道SAN通过诸如ATM这样的广域网互连。在互连的两个场点各配置一个桥接器,该桥接器一端(B端口)连接本地光纤通道SAN交换机的E端口,另一端连接ATM交换机端口。B端口提供E端口功能的一个子集,可以在两个场点的光纤通道交换机的E端口之间透明地传输F类SAN帧。在本例中,光纤通道广域网桥接器使用ATM 虚电路传送SAN帧,从而形成跨越远程的ATM网络的单个光纤通道交换网。
4、FCIP路由器
FCIP路由器是一个IP隧道(Fiber Channel Over IP,在IP上的光纤通道)解决方案。该设各一端(E端口)连接光纤通道交换机,另一端通过以太网链路连接IP路由器。目的地在远程的光纤通道SAN帧被 封装在IP分组中,然后通过IP网络发送。在目的场点的隧道出口处,原始的SAN帧被从IP分组中抽出,再由那里的光纤通道交换机继续转发到目的结点。
FCIP是一个点到点的广域网连接,每条远程链路都需要一对FCIP路由器,并且在每个场点除了端结点外还需要有一台光纤网交换机。
从光纤网SAN的角度看,FCIP在本质上也是一种远程桥接器,但由于它连接光纤网SAN和IP网络,而且还把SAN帧作为载荷封装在IP分组内传送到IP网络,所以从TCP/IP的协议层次看,人们通常把它也称作路由器。
存储设备
存储设备主要包括磁盘系统和磁带系统。
简单地讲,磁盘系统是把若干个物理存储盘组合在一起的设备,所有这些盘都被放在单个机箱里,通常有一个中心的控制单元,负责管理所有的 I/0,并简化与诸如使用服务器或其他磁盘系统的网络集成。取决于这个中心控制单元具体管理磁盘的智能程度,磁盘系统可以是一个 JBOD,也可以是一个RAID。
与磁盘系统类似,磁带系统也包括管理使用磁带所需要的所有设备,然而磁带的串行特征使得它们不可能像RAID那样做并行处理,因此其结构比较简单。
1、磁带驱动器提供读写磁带的物理和逻辑结构,并提供磁带与其他设备连接的途径。
2、磁带自动装载机是自治的磁带驱动器,能够管理磁带并执行自动备份操作。它们通常连接到需要不间断的进行数据备份的高吞吐率的设备。
3、磁带库能够同时管理多个磁带,可以把它看成一组独立的磁带驱动器或自动装载机。
它们通常是在需要非常大的存储容量的系统时使用,或者在需要某种程度的数据分离而导致需要多个单独磁带的系统中采用。由于磁带不是随机存取的媒体,因此磁带库不可能通过提供对多个磁带的并行访问来提高性能,但它们可以提供冗余,作为改善数据可提供性和容错能力的一个途径。
由于磁盘系统的优秀的性能,因而通常被用于在线存储,同时由于其极低的每字节成本而成为离线大吞吐率存储的理想选择
存储软件用于控制存储网络系统中的各种设备及相互间的通信,还提供存储系统与应用程序之间的编程界面以及存储系统与操作人员之间的人机界面。它们包括 SAN管理软件、数据管理、设备控制和管理、存储可视化以及协议软件等。
SAN管理软件通常是由 SAN设备商提供的专门用于管理他们的 SAN设备的软件。数据管理软件是指与一些存储设备 (例如磁带)捆绑的软件,它们具有数据备份、恢复、存档等功能。存储设备控制和管理软件是用于控制和管理各种存储设备的软件。而可视化软件使存储系统的控制和管理可视化,从而使管理工作更容易。协议是指存储设备之间交换数据所遵循的协议,是存储系统正常工作的基石。协议处于存储软件的底层,因而往往不会单独出现。协议一般通过在操作系统上运行的软件或存储硬件的驱动程序实现。光纤通道协议是最常见的协议例子。
当前存储软件发展的热点是存储虚拟化和可视化。存储虚拟化是指把各种复杂的存储硬件以及它们的复杂操作隐蔽起来,提供一个虚拟的统一界面,从而使运行不同操作系统和不同文件系统的服务器都能用同样的界面操作存储系统。而存储可视化则把大量的存储设备使用情况、数据量等信息可视化,为管理人员提供实时的可视化信息,从而使管理更加有效
ISCSI网络存储
使用专门的存储区域网成本很高,而利用普通的数据网来传输ISCSI数据实现和SAN相似的功能可以大大的降低成本,同时提高系统的灵活性。SCSI就是这样一种技术,它利用普通的TCP/IP网来传输本来用存储区域网来传输的SCSI数据块。ISCSI的成本相对SAN来说要低不少。随着千兆网的普及,万兆网也逐渐的进入主流,使ISCSI的速度相对SAN来说并没有太大的劣势。ISCSI目前存在的主要问题是:
1新兴的技术,提供完整解决方案的厂商较少,对管理者技术要求高;
2通过普通网卡存取iSCSI数据时,解码成SCSI需要CPU进行运算,增加了系统性能开销,如果采用专门的iSCSI网卡虽然可以减少系统性能开销,但会大大增加成本;
3使用数据网络进行存取,存取速度冗余受网络运行状况的影响。
SAN 与DAS和NAS的比较DAS的不足
直连式存储依赖服务器主机操作系统进行数据的IO读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的磁带机(库),数据备份通常占用服务器主机资源20-30%。直连式存储与服务器 主机之间的连接通道通常采用SCSI连接,带宽为10MB/s、20MB/s、40MB/s、80MB/s等,随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列的硬盘数量越来越多,SCSI通道将会成为IO瓶颈;在传统的直接附接存储(DAS)模式中,服务器主机SCSI ID资源有限,能够建立的SCSI通道连接有限。SCSI最多允许连接15个设备。这些设各串行地连接在SCSI总线上,设备越多,性能就越低。一台主机上的存储 设备往往不能与其他主机共享。如果一台主机的存储设备已用完,即使其他主机有空闲存储空间,它也难以使用,必须增加新的存储设备。网络附接存储(NAS)在一定程度上解决了直接附接存储存在的问题,很多人把NAS也当作存储区域网系统,但实际上NAS并不是存储区域网。它们之间有一些相同的地方,例如在存储设备和操作数据的主机之间都是通过网络连接的,都有较好的可扩展性,但NAS和SAN之间还是有很大差别的。
NAS和SAN的本质区别
NAS和SAN之间一个本质的区别在于:对用户而言,NAS提供的是文件级服务,而SAN提供的是块存储服务。NAS在存储服务设施中实现文件系统。存储设备一般是通过SCSI并行电缆直接连接到NAS文件服务器,NAS文件服务器负责管理这些存储设备,给应用服务器提供一个或几个文件系统。应用程序对文件系统进行文件级操作,例如打开、读、写、关闭一个文件。NAS文件服务器把对文件的操作映射成对磁盘块的操作,但应用程序不知道文件位于哪个磁盘块。应用服务器和NAS文件服务器之间的数据交换可以通过传统的计算机网络,例如以太网进行。
在SAN中,文件系统位于应用服务器上。应用程序可以对文件进行操作,也可以直接操作存储块。对文件进行操作时,应用服务器把对文件的操作映射成对磁盘块的操作,再把对磁盘块的操作通过SAN执行,最终是附接到SAN的存储设备完成对存储块的操作。因此,对于存储网络的用户而言,NAS提供的是面向文件的存储服务,而SAN提供的是面向存储块的存储服务。
NAS存储设备中的数据通常是通过常规的局域网传输,和其他类型的计算机通信共享网络带宽。大量存储数据的传输将占用较大比例的局域网带宽,特别是在执行数据备份时,上千兆的数据传输会长时间地占用局域网,这会严重影响其他应用程序对局域网的使用。另一方面,如果局域网上有许多应用程序在使用局域网通信,也会使存储数据的传输得不到足够的带宽保证。SAN专用于存储服务的属性可以有效地避免这样的问题。
SAN通常使用适合存储数据传输的光纤通道协议。首先,光纤通道协议的效率比NAS所用的局域网中的TCP/IP协议高。TCP/IP协议中每个协议数据单元的头比光纤通道协议数据帧的头大两倍。其次,光纤通道协议中数据帧的最大长度也比以太网大。因此,鉴于存储网络中经常传大量数据的特点,光纤通道协议更适合在存储网络中使用。
NAS也有自己的优点。首先,NAS文件服务器的管理简单,基本上是即插即用,买来以后连接到局域网上就可以使用了。用户通常使用NFS(NetworkFile System,网络文件系统)软件把磁盘存储设备映射成一个UNIX文件目录,或者使用CIFS软件把磁盘存储设备映射成Windows中的一个虚拟盘;其次,NAS可以利用现有的局域网进行文件传送,而SAN需要购买光纤通道网络设备和主机适配卡,因此,NAS的成本一般低于有同样存储容量的SAN。
SAN与NAS--互为补充的两种技术
尽管它们之间存在着区别,但是SAN和NAS是两种互为补充的存储技术。例如,SAN在数据块传输和扩展性方面表现优秀,并能够有效地管理设备。企业可以从将SAN应用于关键任务应用、存储集中、备份恢复和高可用性计算等方面受益无穷。
与SAN相比,NAS支持多台对等客户机之间的文件共享。NAS客户机可以在企业中任何地点访问共享的文件。因为在NAS环境中文件访问的逻辑卷较少,对于响应时间要求也不是很高,所以其性能和距离要求也相对较低。
下表为SAN与NAS关键特性比较