煮酒品茶:文章大多摘自《分布式文件系统研究》《构建高性能WEB站点》《大型网站技术架构》

文件系统是操作系统的一个重要组成部分,通过对操作系统所管理的存储空间的抽象,向用户提供统一的、对象化的访问接口,屏蔽对物理设备的直接操作和资源管理。


关注的点:

1、存储节点高可用性

2、多个副本的负载均衡

3、异步复制

复制工作是否异步在后台异步进行,会不会阻塞应用程序。

4、提取文件

1、WEB访问地址(一串URL,分发文件?)

2、直接文件对象可视化(类似本地文件系统)


文件系统可划分为四个层次,从低到高依次是:


1、单处理器单用户的本地文件系统,如DOS的文件系统;

2、多处理器单用户的本地文件系统,如OS/2的文件系统;

3、多处理器多用户的本地文件系统,如Unix的本地文件系统;

4、多处理器多用户的分布式文件系统,如Lustre文件系统。


本地文件系统(Local File System)

是指文件系统管理的物理存储资源直接连接在本地节点上,处理器通过系统总线可以直接访问。

分布式文件系统(Distributed File System)

是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。

带内模式(NFS)

所有数据和元数据存放在一起,通过单一的存储服务器提供。

缺点:

1、服务器是瓶颈

2、受I/O和网络I/O影响


存储区域网络(SAN)

将应用服务器直接和存储设备相连接,所有的应用服务器都可以直接访问存储在SAN中的数据,而只有关于文件信息的元数据才经过元数据服务器处理提供.

Storage Tank、CXFS、Lustre、BWFS


区分:

关于文件系统元数据操作的控制信息是否和文件数据一起都通过服务器转发传送。前者需要服务器转发,后者是直接访问。


使用意义:

1、组建海量廉价服务器的海量存储系统

2、冗余复制、保证文件可用性

3、扩展性

4、文件副本的负载均衡


历史

一、1980

NFS、AFS

二、1990-1995

XFS、SFS

三、1995-2000

GFS、GPFS、DIFFS、CXFS、HighRoad、QFS、XWFS

四、2000-

StorageTank、Lustre、RanFS、BWFS

大容量、高性能、高可用性、可扩展性、可管理性、按需服务


高可用服务

包括宕机,硬盘损坏,系统升级,停机维护,集群扩容等情况都可以对系统进行读写访问操作

手段

冗余:服务器热备、数据备份存储,进行失效转移

故障分类

1、瞬时故障

1、网络通信瞬间中断

2、服务器内存垃圾回收

3、后台繁忙停止响应

。。。秒级自动恢复

2、临时故障

1、交换机宕机、网卡松动

2、系统升级、停机维护

3、内存、CPU过热等

.....需要人工干预

3、永久故障

1、硬盘损坏,数据丢失


高可靠数据

任何情况下,数据可靠存储,不丢失。