现向大家推荐一本由大学和博导编写的网络存储方面的书――《
海量网络存储系统原理与设计》了一下目录,里面介绍的技术中有些非常前沿,是系统学习网络存储技术的很好选择 。
互动网预订地址:
http://www.china-pub.com/196658
本书由
国家973重大基础研究项目(项目编号:2004CB318203)、国家自然科学基金重点项目(项目编号:60933002)、国家863计划重大项目(项目编号:2009AA01A402)的资助、国家自然科学基金(项目编号:60603075和60603074)、武汉光电国家实验室创新基金资助出版。
前言
当前,人类社会活动越来越依赖于各种数字化信息。无论是个人的数据资料、企事业单位核心运营数据(学生提交的作业、科研工作者撰写的技术文档、多媒体娱乐文件等,以及工厂的资源管理系统和生产调度系统、企业交易系统等),还是保证国家和社会正常运转的文件(社会经济统计数据、个人和企业的档案税收记录等),都离不开各种海量信息数据的存储、处理和传输。一个观察到的现象是,社会中数据总量增长速度正比于当前社会信息化的程度,这说明数据总量是按指数形式增长,过去几十年的历史数据也证实了这一点,并在短时期内还没有发现什么因素能够延缓这种数据量的增长速度。因此,数据爆炸式增长,并且其重要性不断增加是客观的,这对于存放数据的存储系统提出了巨大的挑战。
虽然在过去几十年中,存储设备的性能和容量得到极大的提高,但在性能方面它还赶不上处理器和网络的性能增长速度;在容量和可用性方面单设备也依然难以满足应用的需求。因此,使用系统的方法提高存储系统的性能、容量和可用性成为必然趋势。与传统计算机系统结构相比,当前存储系统不再仅仅被看做主机的外围
I/O
设备,而是具有高性能处理、存储和网络传输部件的独立计算机系统,能够提供高质量的数据存储服务,这也导致最近
10
年以来,数据存储系统及其相关技术受到越来越多的研究者、市场和用户的关注。
海量网络存储系统由于能够在系统层面包含各种存储部件并融合多种存储技术,提供高性价比的存储服务成为当前研究和应用的焦点。一般而言,海量网络存储系统主要采用高速网络技术连接多个存储设备或者存储节点,使之能够存储海量的数字化信息,也就是说,高速网络互联是手段,高效组织是核心,海量数据存储是目的。本书从设计者的角度讨论高性能、高可用性和高安全性的海量网络存储系统及其部件的设计原则、评价方法、研究手段和实现方法,同时针对一些典型系统和技术给出相应的设计实例。
本书整体分为三个部分:首先,从存储系统整体上高度分析了存储系统的层次性物理与逻辑结构、各种标准存储接口、存取路径及其常用的设计评价原则和方法;其次,从设备、单节点系统和大规模存储系统三个层次分别讨论基本原理和概念、当前的国内外状况、设计和评价方法,然后给出详细的设计实例;最后,针对海量存储系统中的实际功能需求讨论了若干关键问题,包括海量存储系统可靠性和可用性,存取安全和连续数据保护等,在每个专题中给出一些具体的设计优化和实现方案的例子。
本书的作者从理论和实践两个方面,全面系统地对海量网络存储系统各个方面的问题进行深入分析和讨论,并结合自身的科研成果以实例的方式细致描述存储系统的研究手段、实现方式和整体思路。考虑到存储领域,特别是海量网络存储领域,国内外都缺乏能够理论结合实际的资料,相信本书能让广大读者加深理解网络存储系统的运行机制和特点,并能为存储系统研究、开发和产业发展提供一定帮助。
本书共分为
9
章,其中第
1
,
2
,
5
,
6
,
8
,
9
章由曹强撰写,第
4
,
7
章由黄建忠撰写,第
3
章由万继光撰写,全书由谢长生统稿。博士生李红艳、刘洋和陈云亮对书中文字和内容进行录入、编排,吴晨涛、吴丹璐绘制了书中部分图表,在此一并表示感谢。在成书过程中得到了华中科技大学计算机学院和武汉光电国家实验室(筹)领导以及师生的热心支持,书中使用了大量的所在研究组的资料,在此谨以衷心的谢意。
由于作者水平有限,书中难免存在不足之处,敬请读者批评指正。
作者
2009
年
8
月于武汉
目录
第
1
章存储系统设计原理
(1)
1.1
应用需求
(1)
1.1.1
数据量增长
(2)
1.1.2
数据的价值
(2)
1.2
计算机存储系统
(3)
1.2.1
计算机存储系统概述
(3)
1.2.2
存储结构的发展
(6)
1.3
评价指标和功能需求
(10)
1.3.1
评价指标
(10)
1.3.2
功能需求
(11)
1.3.3
典型系统
(12)
1.4
存取路径和接口
(14)
1.4.1
存取接口
(15)
1.4.2
存取路径
(20)
1.5
存储空间组织和管理
(24)
1.5.1
存储空间的基本概念
(24)
1.5.2
存储空间和主机的关系
(26)
1.5.3
存储空间的合并
(27)
1.5.4
存储空间的可用性
(29)
1.5.5
存储系统的层次结构
(29)
1.5.6
存储虚拟化
(30)
1.6
设计方法
(32)
1.6.1
测试方法
(32)
1.6.2
系统仿真
(34)
1.6.3
优化方法
(35)
1.7
本章小结
(37)
参考文献
(39)
第
2
章基本储设备
(41)
2.1
磁盘
(4)
2.1.1
发历史
(41)
2.1.2
理和结构
(42)
2.1.3
数据布局和接口
(43)
2.1.4
存取特性
(45)
2.1.5
磁盘调度
(46)
2.2
固态盘
(48)
2.2.1
原理和结构
(49)
2.2.2
存取特性
(52)
2.2.3
软件系统
(53)
2.3
磁带
(55)
2.3.1
原理和结构
(55)
2.3.2
存取特性
(58)
2.3.3
磁带库系统优化技术
(58)
2.4
光盘
(59)
2.4.1
原理和结构
(60)
2.4.2
存取特性
(61)
2.5
其他存储机制和设备
(61)
2.5.1
体全息光盘
(61)
2.5.2
相变存储器
(63)
2.5.3MEMS
设备
(64)
2.6
本章小结
(66)
参考文献
(67)
第
3
章磁盘列
(68)
3.1
基本理
(68)
3.1.1RAID
级别
(68)
3.1.2RAID
实现方式
(71)
3.1.3RAID
快照技术
(74)
3.2RAID
系统设计
(76)
3.2.1RAID
控制器硬件设计
(76)
3.2.2RAID
核心控制软件
(84)
3.3
磁盘阵列系统性能评价
(93)
3.3.1
磁盘阵列硬件瓶颈分析
(93)
3.3.2PCI
传输瓶颈及优化
(97)
3.3.3
内存访问瓶颈及优化
(99)
3.3.4CPU
运算瓶颈及优化
(100)
3.3.5
硬件性能评估结论
(103)
3.4
磁盘阵列在线扩容技术
(104)
3.4.1
磁盘阵列扩容的一般实现过程
(104)
3.4.2
扩容过程中数据迁移的研究
(108)
3.4.3
基于控制理论的分组分区迁移策略
(110)
3.5
多协议磁盘阵列技术
(114)
3.5.1
外存储设备接口协议
(114)
3.5.2
存储整合
(116)
3.5.3
多协议磁盘阵列系统结构
(116)
3.6
磁盘阵列预警技术
(122)
3.6.1
当前应用需求现状
(123)
3.6.2
国内外相关技术研究现状
(123)
3.6.3
基于安全预警技术的
RAID
系统设计
(126)
3.7
当前阵列的研究热点
(128)
3.7.1
绿色存储简介
(128)
3.7.2
阵列级节能技术
(129)
3.7
本章小结
(133)
参考文献
(134)
第
4
章对象存储系统研究
(136)
4.1
引言
(136)
4.1.1
对象存储技术产生的背景
(136)
4.1.2
常用网络存储系统
(140)
4.1.3
对象存储带来的变化
(144)
4.1.4
对象存储的研究内容
(146)
4.2
对象存储设备的指令集
(151)
4.2.1SCSI
命令集的扩展
(152)
4.2.2OSDT10
的属性页
(154)
4.2.3
属性列表
(156)
4.2.4
对象扩展属性页
(157)
4.3
对象存储文件系统
(158)
4.3.1
分布式文件系统
(158
4.3.2
对象文件系统的设思路
(159)
4.3.3
采用
OSD
的对象文件系统
(160)
4.4
存储服务质量
(164)
4.4.1
存储服务质量的研究意义
(164)
4.4.2QoS
系统结构
(165)
4.4.3QoSS
的实施要素
(167)
4.4.4
面向
QoSS
的属性管理模型
AM
��
M(169)
4.4.5
基于属性管理的流媒体
QoS
保证
(171)
4.5
一种基于属性控制的对象存储文件系统
(174)
4.5.1
对象热度扩展属性页
(174)
4.5.2
文件系统设计
(175)
4.5.3
基于属性管理的应用原型总体设计
(176)
4.5.4
应用原型客户端的设计
(178)
4.5.5
应用原型存储端的设计
(179)
4.5.6
性能评估与分析
(181)
4.6
本章小结
(185)
参考文献
(187)
第
5
章大规模网络存储系统
(191)
5.1
概述
(191)
5.1.1
存储域
(191)
5.1.2
存储域的系统结构和功能需要
(192)
5.1.3
基于网络的文件系统
(196)
5.2
典型分布式文件系统
(198)
5.2.1PVFS(198)
5.2.2Lustre
文件系统
(199)
5.2.3Panasas
文件系统
(202)
5.2.4GPFS(204)
5.2.5GoogleFS(205)
5.2.6Hadoop
分布式文件系统
(205)
5.2.7
分布式文件系统评价
(208)
5.3DNFS
系统设计与实现
(208)
5.3.1DNFS
系统结构
(209)
5.3.2DNFS
实现方法
(213)
5.3.3
测试与分析
(229)
5.4
本章小结
(237)
参考文献
(238)
第
6
章可靠性和可用性研究
(239)
6.1
可靠性概述
(239)
6.1.1
背景
(240)
6.1.2
可靠性和可用性
(240)
6.2
容错机制
(244)
6.2.1
容错机制的分类
(244)
6.2.2
容错机制的层次分析
(245)
6.3
可靠性研究
(247)
6.3.1
磁盘失效数据
(247)
6.3.2
磁盘阵列的可靠性结构和模型
(249)
6.3.3
集群存储系统的可靠性结构和模型
(250)
6.3.4Monte Carlo
法模拟系统运行
(252)
6.4
集群存储系统的容错机制
(253)
6.4.1
集群存储系统容错
(253)
6.4.2
纠删码的选择
(254)
6.4.3LDPC
编码
(255)
6.4.4
系统实现
(256)
6.4.5
性能评估
(258)
6.5
本章小结
(261)
参考文献
(262)
第
7
章存储安全性研究
(266)
7.1
引言
(266)
7.2
存储安全研究现状
(269)
7.2.1
现有原型系统
(269)
7.2.2
现有研究的分析
(272)
7.2.3
存储安全研究范畴
(273)
7.3
存储安全的一般性原理
(275)
7.3.1
怎样研究网络存储安全
(275)
7.3.2
存储安全的三大特征
(277)
7.3.3
安全存储数据通道
(279)
7.3.4
服务独立的存储安全服务模型
(280)
7.3.5
安全访问协议
(282)
7.4
典型存储安全案例研究
(283)
7.4.1
存储设备的安全性
(283)
7.4.2
常用存储系统的安全性
(287)
7.4.3
对象存储安全性研究
(290)
7.4.4
大规模存储系统及其安全性
(294)
7.5
本章小结
(296)
参考文献
(297)
第
8
章连续数据保护
(300)
8.1
连续数据保护技术
(300)
8.1.1
数据恢复的技术指标
(300)
8.1.2
数据恢复级别
(301)
8.2ST
��
CDP
机制
(303)
8.2.1
当前
CDP
机制存在的问题
(303)
8.2.2
数据记录
(303)
8.2.3
数据恢复
(304)
8.3
量化分析模型
(304)
8.4
机制实现
(306)
8.4.1
系统架构
(306)
8.4.2
机制实现的相关问题
(307)
8.4.3
工作流程
(308)
8.4.4
设计方法改进
(311)
8.5
实验分析
(311)
8.5.1
测试环境设置
(311)
8.5.2
测试结果与分析
(312)
8.6
本章小结
(318)
参考文献
(319)
第
9
章网络存储备份系统
(320)
9.1
复制和镜像技术
(320)
9.2
备份系统概述
(322)
9.3
备份系统基本结构
(324)
9.4
典型网络备份系统的设计
(326)
9.4.1
网络备份系统的结构与业务逻辑
(326)
9.4.2
网络备份系统的软件设计
(329)
9.4.3
网络备份系统性能测试
(336)
9.5
本章小结
(338)
参考文献
(339)
附录存储安全的相关术语表
(340)