在上篇 文件IO 文件系统调用 文件fd 重定向 文章中,我们已经学习了在内存中被打开(被加载)的文件,还有一部分是磁盘中未被打开的文件。这篇我们来谈磁盘文件。
Linux对文件的管理工作:
以上两点构成了Linux的文件系统,文件系统
这个名词狭义上指的是磁盘文件系统,例如Linux下的ext2文件系统。
Boot Block(引导块):
可以通过以下命令查看当前Linux系统的分区:
- 使用
lsblk
命令:lsblk /dev/vda
上述命令会列出
/dev/vda
设备的分区信息,包括每个分区的大小、挂载点等。
- 使用
fdisk
命令:sudo fdisk -l /dev/vda
上述命令会显示
/dev/vda
设备的分区表信息,包括每个分区的起始扇区、大小等。可能要使用sudo提权。
- 使用
df -h
df -h
相当于Windows的 “此电脑”,
df -h
提供了一个快速的方式来查看系统上各个文件系统的存储使用情况,以便及时了解磁盘空间的分布和使用率。
ext2文件系统会根据分区的大小划分为数个块组(Block Group)。而每个块组都有着相同的结构组成。块组
也被称为分组
,块组
是由分区
细分出的产物。
其中,写入的管理信息是什么是由文件系统决定的,不同的文件系统格式化时写入的管理信息是不同的,常见的文件系统有EXT2、EXT3、XFS、NTFS等。
当我们考虑一个块组中的内容时,以下是一个块组中包含的内容:
定义: 组描述符表存储了关于每个块组的元信息,包括块组中的inode和数据块的位置,以及空闲块和inode的数量等信息。
作用: 提供了有关块组的重要信息,帮助文件系统在块组级别进行管理和分配。
组描述符表中的主要信息包括:
1. 块组的起始块号: 记录块组的起始块号,用于定位块组在整个文件系统中的位置。
2. 块位图的起始块号: 记录块组中块位图的起始块号,用于定位块组中块的分配情况。
3. Inode位图的起始块号: 记录块组中Inode位图的起始块号,用于定位块组中Inode的分配情况。
4. Inode表的起始块号: 记录块组中Inode表的起始块号,用于定位块组中Inode的存储位置。
5. 空闲块的数量: 统计块组中未分配的空闲块数量。
6. 空闲Inode的数量: 统计块组中未分配的空闲Inode数量。
一个典型的
inode
结构包含以下信息:
文件类型(File Type): 表示Inode关联的文件类型,如普通文件、目录、符号链接等。
权限和所有者信息:
- 文件所有者(User ID)
- 文件所属组(Group ID)
- 文件权限(Read、Write、Execute)
时间戳:
- 文件的最后访问时间(atime)
- 文件的最后修改时间(mtime)
- Inode的最后修改时间(ctime)
文件大小: 记录文件的大小(以字节为单位)。
链接数: 记录连接到该Inode的硬链接数量。当链接数为0时,表示文件不再被引用,可以被删除。
数据块指针:
- 直接块指针(Direct Block Pointers):用于存储文件的前一定量数据块。
- 单间接块指针(Single Indirect Block Pointer):指向一个块,该块包含更多数据块的指针。
- 双间接块指针(Double Indirect Block Pointer):指向一个块,该块包含单间接块的指针。
文件系统标志: 记录Inode所属的文件系统的特定标志。
在Linux操作系统的ext2文件系统中,通过一个文件的inode找到该文件的过程涉及到文件目录、内核缓冲区等关键概念。以下是找文件的步骤:
文件目录(Directory):
查找文件的inode:
opendir
、readdir
来实现。读取目录文件:
readdir
等,内核将目录文件的内容读入内核缓冲区。在内核缓冲区中查找目录项:
目录项
目录项是文件系统中的一个记录单元,用于将文件名与其对应的inode号关联起来。每个目录项包含一个文件或目录的名称以及与之相关联的唯一标识符(inode号),该标识符用于定位并访问文件或目录的详细元数据。目录项是构建目录结构的基本组成部分,使得文件系统能够有效地组织和检索文件。
获取文件的inode号:
访问文件的inode:
stat
)来获取文件的详细元数据。这涉及到文件系统的访问操作,文件系统会将对应inode的信息读取到内核缓冲区中。获取文件的数据块:
读取文件内容:
总体而言,文件系统通过在文件目录中查找文件名与inode号的映射关系,然后通过inode号来获取文件的详细信息,最终访问文件的实际数据块,实现了从用户提供的文件名到文件内容的映射过程。这一系列操作都依赖于内核缓冲区。
因为删除操作并不会真正将文件对应的信息删除,而只是将其inode号和数据块号置为了无效,所以当我们删除文件后短时间内是可以恢复的,在删除后,有些操作系统会记录日志,日志中会保存被删的inode编号!
为什么说是短时间内可恢复呢?因为该文件对应的inode号和数据块号已经被置为了无效,因此后续创建其他文件或是对其他文件进行写入操作申请inode号和数据块号时,可能会将该置为无效了的inode号和数据块号分配出去,此时删除文件的数据就会被覆盖,也就无法恢复文件了。