第16章 页高速缓存和页回写

页高速缓存是Linux内核实现磁盘缓存,主要用来减少对磁盘的I/O操作,这么做的原因是:

  • 访问磁盘的速度远远低于访问内存的速度
  • 临时局部原理:数据一旦被访问,就很有可能在短期内再次被访问到。

一、缓存手段

页高速缓存是由内存中的物理页面组成的,其内容对应磁盘上的物理块。页高速缓存大小能力可以动态调整,被缓存的存储设备称为后备存储。

1.1 写缓存

缓存一般有三种策略:

  • 不缓存:不缓存任何写操作
  • 写透缓存(write-through cache):写操作将自动更新内存缓存,同时也更新磁盘文件,缓存数据和后备存储保持同步。
  • 回写策略:Linux采用的策略,写操作直接写到缓存中,后备存储不会立即更新,而是将页高速缓存中被写入的页面标记成脏,并加入到脏页链表中。然后由一个回写进程周期将脏页链表中的页回写到磁盘中,从而使磁盘和内存中的数据一致。最后清理脏页标志。

1.2 缓存回收

Linux缓存回收是通过选择干净页进行简单替换。如果缓存中没有足够的干净页,内核将强制进行回写操作,以腾出更多的干净可用页。最难的事情在于决定什么页应该回收,相关策略有:

  • 最近最少使用(LRU):跟踪每个页面的访问踪迹(或按照访问时间为序的页链表),以便能回收最老时间戳的页面(或回收排序链表头所指的页面)。
  • 双链策略(LRU/2):维护两个LRU链表,即活跃链表和非活跃链表。前者不会被换出,后者的页面可以被换出。活跃链表的页面必须在其访问时就处于非活跃链表上,如果活跃链表对于非活跃链表,那么前者的头页面被重新放回非活跃链表中。

二、Linux页高速缓存

页高速缓存缓存的是内存页面。缓存中的页来自对正规文件、块设备文件和内存映射文件的读写。

页高速缓存中的页可能包含多个不连续的物理磁盘块,Linux使用address_space结构体管理缓存项和页I/O操作。

每个缓存文件只和一个address_space结构体相关联:

/**
 * struct address_space - Contents of a cacheable, mappable object.
 * @host: Owner, either the inode or the block_device.
 * @i_pages: Cached pages.
 * @gfp_mask: Memory allocation flags to use for allocating pages.
 * @i_mmap_writable: Number of VM_SHARED mappings.
 * @nr_thps: Number of THPs in the pagecache (non-shmem only).
 * @i_mmap: Tree of private and shared mappings.
 * @i_mmap_rwsem: Protects @i_mmap and @i_mmap_writable.
 * @nrpages: Number of page entries, protected by the i_pages lock.
 * @nrexceptional: Shadow or DAX entries, protected by the i_pages lock.
 * @writeback_index: Writeback starts here.
 * @a_ops: Methods.
 * @flags: Error bits and flags (AS_*).
 * @wb_err: The most recent error which has occurred.
 * @private_lock: For use by the owner of the address_space.
 * @private_list: For use by the owner of the address_space.
 * @private_data: For use by the owner of the address_space.
 */
struct address_space {
    struct inode        *host;
    struct xarray       i_pages;
    gfp_t           gfp_mask;
    atomic_t        i_mmap_writable;
#ifdef CONFIG_READ_ONLY_THP_FOR_FS
    /* number of thp, only for non-shmem files */
    atomic_t        nr_thps;
#endif
    struct rb_root_cached   i_mmap;
    struct rw_semaphore i_mmap_rwsem;
    unsigned long       nrpages;
    unsigned long       nrexceptional;
    pgoff_t         writeback_index;
    const struct address_space_operations *a_ops;
    unsigned long       flags;
    errseq_t        wb_err;
    spinlock_t      private_lock;
    struct list_head    private_list;
    void            *private_data;
} __attribute__((aligned(sizeof(long)))) __randomize_layout;

物理页中包含了address_space结构体指针:

struct page {
  unsigned long          flags;//页的状态
  atomic_t               _count;//引用计数
  atomic_t               _mapcount;
  unsigned long          private;
  struct address_space   *mapping;
  pgoff_t                index;
  struct                 list_head;
  void                   *virtual;//页的虚拟地址
};

三、缓冲区高速缓存

独立的磁盘块通过块I/O缓冲也要被存入页高速缓存,称为缓冲区高速缓存。

四、flusher线程

在以下情况下,内核会唤醒一个或多个flusher线程对脏页进行回写:

  • 当空闲内存低于一个阈值时,内核必须将脏页回写到磁盘,使脏页变为干净页,然后便可以回收干净页以释放内存。
  • 当脏页在内存中驻留时间超过阈值时,内核必须将超时脏页写会磁盘,以确保脏页不会无限期驻留在内存中。
  • 当用户进程调用sync()和fsync()系统调用时,内核会按要求执行回写动作。

你可能感兴趣的:(第16章 页高速缓存和页回写)