集中式存储和分布式存储

文章目录

  • 集中式存储
    • DAS(Direct Attached Storage,直接连接存储)
    • NAS(Network Attached Storage,网络附加存储)
    • SAN(Storage Area Network,存储区域网络)
  • 分布式存储
  • 集中式存储和分布式存储的区别
    • 存储环境
    • 存储方式
    • 其他方面
  • 存储的未来
  • 参考

集中式存储

集中式存储是指将数据存储在由一台或者多台主机组成的中心节点上。集中式存储所有的业务均集中部署在中心节点上,中心节点统一管理各分部节点的数据,按需分配,数据访问仅需经过一个控制器即可实现。集中式存储分为DASNASSAN三类,可以根据不同的数据存储需求选择不同的存储类型。

集中式存储和分布式存储_第1张图片

DAS(Direct Attached Storage,直接连接存储)

直接连接存储是指将存储设备通过计算机主机的接口直接连接到服务器上。信息被直接存放在服务器上,节点通过指令可随时读写存储的信息,实现对存储信息的维护管理。DAS具有便捷、高效的优点,但不能满足高性能的需求和大规模的使用,无法支持高并发。

主要问题和不足:

  • 直连式存储依赖服务器主机操作系统进行数据的IO读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的磁带机(库),数据备份通常占用服务器主机资源20-30%,因此许多企业用户的日常数据备份常常在深夜或业务系统不繁忙时进行,以免影响正常业务系统的运行。直连式存储的数据量越大,备份和恢复的时间就越长,对服务器硬件的依赖性和影响就越大。

  • 直连式存储与服务器主机之间的连接通道通常采用SCSI连接,带宽为10MB/s、20MB/s、40MB/s、80MB/s、320MB/s等,随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列的硬盘数量越来越多,SCSI通道将会成为IO瓶颈;服务器主机SCSI ID资源有限,能够建立的SCSI通道连接有限。

NAS(Network Attached Storage,网络附加存储)

网络附加存储是将存储设备通过网络拓扑结构接入到节点上,并将存储设备的文件系统迁移到中心节点的网络设备上,任一节点可通过协议读写其他节点的文件。NAS设备易部署,具有即插即用、灵活的特点,但文件系统的备份也会消耗大量的带宽。

SAN(Storage Area Network,存储区域网络)

存储区域网络是通过专用高速网连接存储阵列和服务器主机,形成一个专用的存储网络。SAN通过光纤媒介支持广泛使用的SCSI和IP协议,实现存储信息的集中管理、动态存储、各取所需。SAN综合了DAS、NAS的优势,但是成本和复杂性受信息传输距离影响较大。

集中式存储和分布式存储_第2张图片

分布式存储

分布式存储是一种数据存储技术。在分布式存储架构中,信息被存储于多个独立且互不干扰的设备中。不同于传统的集中式存储,分布式存储采用可扩展的存储结构,这在一定程度上提高了存储系统的可靠性,可用性和访问效率。

分布式存储的原理在于,数据被分散存储在多个独立的存储服务器上,这些分散的数据存储服务器构成了一个虚拟的存储系统。分布式存储使用的负载均衡技术可以有效避免系统中可能出现的数据存储不均衡问题。分布式存储系统可将底层存储设备的资源整合,在性能允许的情况下,将饱和设备中的数据划分到其他底层存储设备上,从而实现分布式存储的负载均衡

集中式存储和分布式存储的区别

随着计算机体系结构的不断发展,计算机的存储方法也随之改变,不再局限于单一的集中式存储,而是由集中式存储向分布式存储逐步过渡。分布式存储是指设备之间通过拓扑网络来协调、调动存储的信息。集中式存储和分布式存储的区别有以下几点:

存储环境

集中式存储的存储媒介耦合性高,中心节点设备要求存放在空间大、通风散热好的环境中;分布式存储的媒介分布在不同的网络区域,设备数量多、冗余性强、位置分散,对机房环境要求不高。

存储方式

集中式存储的硬件架构采用集中管理的方式,输入输出路径短,对文件存储系统、节点管理较集中。集中式存储支持多个紧耦合控制器,通过端口实现节点之间互连,共享磁盘阵列和缓存,以提高复用性能。同时集中式存储器有掉电保护、双活、容灾、CDP 等技术保障系统的冗余和数据的安全。分布式存储采用通用的服务器硬件标准,将存储服务器通过高速以太网互连,节点之间对等,冗余性高。分布式存储实现了存储硬件和软件的互不影响,减少数据传输的干扰,使得信息存储和传输更敏捷,不仅运维成本低,而且也符合数据存储的发展趋势。

其他方面

  1. 数据更新在集中式存储中管理和更新数据更为容易,因为它只涉及一个数据库。但在分布式存储中,由于涉及到多个数据库,管理和更新数据也就需要花费更多时间。
  2. 数据访问在用户数量相同的情况下,集中式存储可能需要更多时间来访问系统获取数据,但分布式存储不需要太多时间,因为文件可直接从距离最近的数据库中检索查阅。
  3. 数据库故障集中式存储中的数据库如果发生故障会影响到所有的用户。但是分布式存储的数据库发生故障不会造成大规模影响,因为它是由多个独立存储设备合成的数据库系统,除去发生故障的数据库,其他的数据库仍然可以正常访问。
  4. 数据一致性集中式存储为用户提供了单一完整的数据视图,而分布式存储可能由于不同数据库间的数据复制错误而产生数据的差异变化,这就造成了数据的不一致。

存储的未来

存储需求、存储环境、应用场景、数据存储架构在不断地发生改变,数据存储不再是单一的集中式存储。在低延迟、节点数相对固定的应用场景中,集中式存储依然是主流,但从容量规模的角度看,集中式存储会逐渐被分布式存储所取代。结合集中式存储和分布式存储的优缺点来看,低延时、高容量、高吞吐、高性能是未来数据存储的主流,未来数据存储将会是集中式和分布式相互促进发展的局面

参考

  • https://www.cnblogs.com/yangmingxianshen/p/8390571.html
  • https://www.amazonaws.cn/knowledge/what-is-centralized-storage/
  • https://www.amazonaws.cn/knowledge/what-is-distributed-storage/

你可能感兴趣的:(分布式存储Ceph,分布式)