存储介质
硬盘类型
硬盘关键指标
主流硬盘
机械硬盘与ssd硬盘的区别
因为磁头顺序移动,随机读写时,磁头不停的移动,时间都花在了磁头寻道上,使得机械硬盘连续读写性好,随机读写性差。
企业设备存储规划
企业级存储(便宜大碗)
主流硬盘类型
补充
网络存储技术
分类
概述
即独立磁盘冗余阵列,raid是一种把多块独立的硬盘按不同的方式组合起来形成一个硬盘组(逻辑上的硬盘组),从而提供比单个硬盘更高的存储性能和数据冗余技术。
大型磁盘阵列机控制部分与磁盘阵列部分采用分开的设备,存储容量可达到数百tb
磁盘阵列机采用精简型操作系统,如Linux等
磁盘阵列机可以通过自带的网卡接连到网络中
而组成磁盘阵列的不同方式又可以分出raid级别。
组织方式
将一个分区分成多个大小相等、地址相邻的块,这些块成为分块。他是组成条带的元素。这里的条带指的是同一磁盘阵列中多个磁盘驱动器上相同位置的分块。
raid级别
0 :条带化结构,由raid控制器将文件分割成大小相同的数据块,同时写入阵列中的磁盘,连续存储的数据块就像一条带子横跨所有的磁盘,每个磁盘的数据块大小都是相同的。一次具有很高的数据传输率,但是它没有数据冗余,尽管不占用cpu资源,但并不能算是真正的raid结构,raid 0 只是单纯的提高性能并没有为数据的可靠性提供保证,若其中一个磁盘失效将影响到所有数据。
1:镜像结构
他是通过磁盘阵列数据镜像实现数据冗余,在承兑的独立磁盘上产生互为备份的数据,100%的数据冗余。在原始数据繁忙时,可直接从镜像拷贝中读取数据,因此raid1可以提高读取性能,raid1的成本比较高,其硬盘控件利用率只有1/2
当一个磁盘失效时,系统可以自动切换到镜像磁盘读写,而不需要重组失效的数据,提供了较高的数据安全性和可用性。
但是缺点也很明显,因为提供的有利的容错能力,却牺牲硬盘容量为代价获得效果。
RAID5把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上,其中任意N-1块磁盘上都存储完整的数据,也就是说有相当于一块磁盘容量的空间用于存储奇偶校验信息。因此当RAID5的一个磁盘发生损坏后,不会影响数据的完整性,从而保证了数据安全。当损坏的磁盘被替换后,RAID还会自动利用剩下奇偶校验信息去重建此磁盘上的数据,来保持RAID5的高可靠性。
优点
缺点
应用范围
适合文件服务器 email服务器 web服务器等io密集的可随机读写的应用环境
raid 6
RAID6全称为Independent Data Disks with two Independent Distributed Darity Schemes(带有两个独立分布式校验方案的独立数据磁盘)
RAID 6技术是在RAID 5基础上,为了进一步加强数据保护而设计的一种RAID方式,实际上是一种扩展RAID 5等级。与RAID 5的不同之处于除了每个硬盘上都有同级数据XOR校验区外,还有一个针对每个数据块的XOR校验区,RAID 6 是在RAID-5基础上把校验信息由一位增加到两位的RAID级别。
RAID6的优点是快速的读取性能,更高的容错能力;而它的缺点是很慢的写入速度,RAID控制器在设计上更加复杂,成本更高。
工作原理
p0 即验证d0-d3
dp0 即验证斜向d0到d15
特点
优点
缺点
应用范围
对数据准确性和完整性要求极高的环境
raid 1+0
高可靠性于高效相结合的磁盘结构,是将镜像于条带进行的两级组合,所以只有1/2的磁盘利用率
适合银行 证券累对数据敏感较高的企业
优点
缺点
磁盘利用率低,只有1/2的硬盘利用率,所以至少需要4块磁盘
存储主要使用的协议
存储网络
das(direct attached storage)直接存储网络
san(storage area network)
特点
分类
nas(entwork attached storage)
三种存储技术比较
注 san与nas不是互相竞争的技术,越来越多的数据中心采用san+nas的方式实现数据整合 高性能访问 文件共享服务
概述
业务提出存储资源需求后,需要对存储性能进行计算
存储性能包括: IOPS、存储带宽、存储容量
业务通常从两个维度提出存储的需求:
存储架构选择
存储性能指标iops(每秒输入输出的次数)
iops作为衡量读写性能指标的重要标准。如下图所示,机械硬盘连续读写性很好,但随机读写性能很差,以为磁头移到正确磁道上需要时间,随机读写磁头需不停的移动,时间都花在寻道上,所以性能不高。
固态硬盘ssd是一种电子设备,避免了传统磁盘在寻找和选装上所花费的时间,存储单元寻址开销大大降低,一次iops可以非常高,能够达到数万甚至数十万。
然而固态硬盘的缺点也很明显:价格昂贵、容量小、寿命短、数据安全、干扰(磁场静电)
注: 随机读写频繁的应用有,小文件存储(图片)、oltp(面向交易处理系统,其基本特征是客户的原始数据立即传送到计算中心进行处理,并很短的时间内给出处理结果)数据库、邮件服务器,这些更关注iops指标。顺序读写频繁的应用有电视台视频编辑、视频点播等,这些更关注吞吐量的指标。
存储性能iops计算公式(重点)
存储性能(iops)=tpc/t * s * f
tpc:服务器性能指标
t:每分钟的业务交易量,如果是每秒的交易量则t=60
s:经验值根据行业经验,通过tpc复杂度 交易内核 交易环节 硬件配置 软件效率综合表现
f:未来发展的冗余,一般按照每年10%-30%的发展速度来计算,综合值位20%,即如果按照3年来规划指定,则 f=(1+20%)^3=2.49
通常一个tpc复杂度会有几个读 写 修改等操作组成。
低io应用:tpc取值20-30
中io应用:tpc取值30-50
高io应用:tpc取值50-80 80-100
设备iops计算公式(重点)
设备iops=单盘iops * 磁盘总数 * 有效iops比例
以raid5为例,完成写操作需要:
可以看出多了3次io(称为写惩罚)
假设用户办公产生的写比例位x%,则有效iops=1(1+3x%)
总结一下,不同类型的写比例的有效iops值
raid5=1/(1+3写比例值)
raid6=1/(1+5写比例值)
raid10=1/(1+写比例值)
下图为设备iops值
(1) 某业务规划tpc值为100w,为3年内业务存储规划,预估每年增长20%,请就算iops和磁盘数量:
解:
由公式iops=tpc/tsf=100w / 60 * 50 (1+20%)^3=144w
又因为:选用sas 3.5 15000rpm sas 146 iops
所以 需计算该盘设备iops=单盘iops * 磁盘总数 * 有效iops比例=14012*(1+3*5%)=1460
综上所述:
需要的raid5盘数: 144w/1460 约等于 1000
又因为一个raid5有12盘 所以 总共需要1000*12=12000盘
(2)业务需求:满足6000iops,使用硬盘10tb fc 15k rpm,且读写比例为2比1,计算raid5,raid10分别需要多少块硬盘。
解:使用硬盘10tb fc 15k rpm 即单盘iops为180
由公式 设备iops=单盘iops磁盘总数有效iops比例
得:磁盘总数=设备iops/单盘iops/有效iops比例
即:
raid5磁盘总数=6000/180/(1+3*1/3)=67
raid10磁盘总数=6000/180/(1+1/3)=45
实际宽带计算
存储架构:fcsan ipsan nas
实际带宽计算公式:BUL/S
B:带宽
U:宽带利用率
L:包头损失率
S:bit和byte的转换值,为8
计算举例
ipsan带宽利用率约为60%,其中包头损失20%性能,因此千兆带宽的实际带宽为:
1000M * 0.6 * (1-0.2) / 8 = 60M
fcsan带宽利用率大约为80%,包头损失可忽略不计,4g fcsan带宽为:
4000M * 0.8 / 8 = 400M
业务存储带宽计算过程
架构衡量:应用数据库主要分为:oltp和olap两种访问模式,分别为随机读写和顺序读写
业务带宽需求=task * (x%oltp数据块大小+y% * olap数据块大小)
根据大型应用的特点,oltp的应用为olap的9倍,即oltp:olap=9:1
根据此特点,我们以Oracle数据库为例,通常Oracle中默认的数据块定义为8kb(oltp),olap的数据块为64k。
计算举例
22500人的企业,在线并发数2250人/秒,其中每人提交2个事物请求。
由公式可得:该企业实际业务存储带宽需求为:(22500 * 2 ) * ( 0.9 * 8 + 0.1 * 64) = 59.8M
存储带宽计算
计算输入:存储设备接口总带宽、冗余系数(建议取值15%)
计算公式:存储设备接口总带宽 * (1-冗余系数)
计算举例:
存储配置容量
公式:存储配置容量=存储需求容量 / 存储冗余 * 未来发展容量需求
注:
案例
如果一个企业当前总需求为10t,需要计算三年内容量需求
存储容量=存储需求容量/存储冗余*未来发展容量需求
= 10t * (1-0.35) * (1+0.2)^3 =26.59t