Linux中的EXT2文件系统

1.分区

分区是为了方便操作系统在一块硬盘上进行数据访问,即去哪里读取数据。

分区的要点是记录每一个分区的起始和结束柱面。这个数据存在MBR的分区表中。MBR只能存四个分区的记忆,可以是四个主分区或三个主分区一个扩展分区。(3P+1E或4P)

2.文件系统

对分区进行格式化是为了在分区上建立文件系统。一个分区通常只能格式化为一个文件系统,但是磁盘阵列等技术可以将一个分区格式化为多个文件系统。

划分好分区后,接着就要将分区格式化为操作系统能识别的文件系统了。比如针对linux就要格式化成它能识别的如EXT2文件系统,格式化成windows的文件系统就不行。

理论上说,一个分区只能就是一个文件系统。不能将分区格式化为ext3的同时也格式化成fat32。

硬盘的最小存储单位是扇区,但是磁头一个扇区一个扇区的读取效率太低,因此有了逻辑块的概念,它的大小是扇区的2^n倍。这样磁头就可以一次读一块。但是块的大小规划并不是越大越好,比如块大小规划为4KB,假设一个文件只要0.1KB,根据ext2文件系统的规定,一个块最多只能容纳一个文件,所以剩余的3.9KB就浪费了。因此在规划块的大小时,要考虑两个问题:

  • 文件读取的效率;
  • 文件大小可能造成硬盘空间的浪费。

3.inode

linux 系统中每个文件包括内容数据和文件属性两部分,这两部分分开来存储,文件内容存在块中,文件属性存在inode中。当分区被初始化为ext2文件系统时,它一定会有inode表和块区域这两个区域。inode记录文件的属性,以及文件内容放在哪个块中。这些属性包括:

  • 该文件的存取模式(read/write/excute);
  • 该文件的拥有者与群组(owner/group);
  • 该文件的容量;
  • 该文件创建或状态改变的时间(ctime);
  • 最近一次的读取时间(atime);
  • 最近修改的时间(mtime);
  • 定义文件特性的旗标(flag),如 SetUID...;
  • 该文件真正内容的指向 (pointer);

一个inode的大小为128个字节。

4.Linux的EXT2文件系统

Linux系统是如何读取一个文件的?下面分别针对目录和文件来说明:

  • 目录

ext2文件系统建立一个目录时,会给该目录分配一个indoe和至少一个块。inode记录该目录的相关属性,并指向分配到的那个块。这个块记录了这个目录下的相关文件或目录的关联性。

  • 文件

建立普通文件时,会给该文件分配一个inode与相对于该文件大小的块数量。如一个块大小为4KB,建立一个100KB的文件,linux将分配一个inode和25个块来存储该文件。

注意inode本省不记录文件名,而是记录文件的相关属性,文件名是记录在目录所属的块区域中的。

Linux中的EXT2文件系统_第1张图片 

因此要读取一个文件的内容时,Linux会从 / 开始,一直获取到该文件的上层目录所在的inode,再由该目录的块区域中的文件名对应的inode号来找到对应的文件,最后根据inode中的指针找到最终的文件内容。

 如上图,读取/etc/crontab的流程为:

1.根据/根目录的块中找到/etc对应的inode号

2.根据/etc 目录的块中的inode数据,查找到crontab的inode号

3.根据查到的inode号来获取该文件的属性,并且前往该inode所指的块,顺利获取crontab 的文件内容。

注意:

1.块和inode在一开始初始化时就已经固定好了。

2.分区的规划不是越大越好,因为硬盘上的数据进进出出,整个分区上的文件无法连续写在一起,而是填入式的,将数据填入没有使用的块中。如果文件写入的块太分散,就会有文件碎片产生,比如一个文件分别记录在分区的最前面和最后面的块时,会造成机械手臂移动幅度过大,数据读取效率就很低。所以要针对主机的具体用途去规划 。

Linux中的EXT2文件系统_第2张图片

3.在建立每个ext2文件系统时,会按照分区大小,确定若干个块组(block group),每个块组如上图又包括:

超级块:记录这个文件系统相关信息,没有它就没有这个文件系统。它记录的主要信息包括inode/block的总量,使用量,剩余量,以及文件系统的格式与相关信息;

组描述:记录这个块从何处开始记录;

块位图:通过block bitmap来记录每个block的状态,如是否被使用,这样操作系统可以很快去找到空的block分配给新文件;

inode位图:与block bitmap类似,记录每个inode的状态,如是否已经被使用,这样操作系统可以很快去找到空的inode分配给新文件;

inode table: 多个inode的信息;

Data Blocks: 每个块组的数据存放区。

当新建一个文件或目录时:

1.根据inode位图/块位图的信息,找到尚未使用的inod与块,将文件的属性和数据分别写入inode与块。

2.将刚刚使用的inode与块的号码告知超级块、inode位图、块位图等,让这些元数据更新。

日志

如果突然断电,那么文件系统会发生错误,比如数据只记录到上述的操作1,操作2尚未进行,就会发生元数据和数据存放区不一致的情况。如果强制进行一致性检查,需要检查整个分区,很费时。因此引入日志系统进行文件操作的记录,可以简化一致性检查的步骤:ext3/ext4 文件系统引入了日志功能,可以利用日志来修复文件系统。

参考:鸟哥的linux私房菜

你可能感兴趣的:(Linux)