InnoDB体系架构 内存

      在上一篇博客InnoDB体系架构 后台线程中我介绍了该引擎的后台线程是怎样的,这篇博客接着来介绍它的内存。

1.缓冲池

      InnoDB存储引擎是基于磁盘存储的并将其中的记录按照页的方式进行管理。因此可以将其视为基于磁盘的数据库系统,在数据库系统中由于CPU速度和磁盘速度之间的鸿沟,基于磁盘的数据库系统通常使用缓冲池技术来提高数据库的整体性能。

      缓冲池简单来说就是一块内存区域,通过内存的速度来弥补磁盘速度较慢对数据库性能的影响。在数据库中进行读取页的操作,首先将磁盘读到的页存放在缓冲池中,这个过程称为将也“FIX”在缓冲池中,下一次再读相同的页的时候,首先判断该页是否在缓冲池中,若在则称该页在缓冲池中被命中,直接读取该页否则读取磁盘上的页。

      对于数据库中页的修改操作,则是首先修改在缓冲池中的页,然后再以一定的频率刷新到磁盘上,但是要注意的是,页从缓冲池刷新回磁盘的操作并不是在每次页发生更新时触发,而是通过CheckPoint的机制。我们可以通过如下图所示的指令来查看InnoDB引擎缓冲池的大小:

InnoDB体系架构 内存_第1张图片

      我们可以看到缓冲池的大小为8G。具体来看的话,缓冲池中缓存的数据页类型有:索引页、数据页、undo页、插入缓冲(insert buffer)、自适应哈希索引(adaptive hash index)、InnoDB存储的锁信息(lock info)、数据字典信息(data dictionary)等。可以用下面一张图来展示InnoDB存储引擎中的内存结构(图片来自MySQL技术内幕):

      此外InnoDB存储引擎允许有多个缓冲池实例,每个页根据hash值平均分配到不同的缓冲池实例当中去。我们可以通过一下命令来查看缓冲池的数量:

InnoDB体系架构 内存_第2张图片

      默认值是1,我们可以再配置文件中将Innodb_buffer_pool_instances设置为其它值就可以得到多个缓冲池实例了。

2.LRU List、Free List和Flush List

      一般而言,数据库中的缓冲池是通过LRU(Latest Recent Used)算法来进行管理的,即最频繁使用的页在LRU列表的前端,而最少使用的页在LRU列表的尾端,当缓冲池不能存放新读取到的页时,将首先释放LRU列表中尾端的页。在InnoDB的存储引擎中,对该算法进行了改进,在LRU列表中加入了midpoint位置,新读取到的页,并不是直接放入到LRU列表的首部,而是放入到LRU列表的midpoint位置。默认配置下该位置在LRU列表长度的5/8处,midpoint位置可以有参数innodb_old_blocks_pct控制如下图所示:

InnoDB体系架构 内存_第3张图片

      我们可以很直观的看到innodb_old_blocks_pct默认值是37,表示新读取到的页插入到LRU列表尾端的37%的位置,再midpoint之前的列表称为new列表,在midpoint之后的称为old列表。不采用朴素的LRU算法是为了防止SQL中的索引或者数据的扫描等操作,一次性读取过多的页从而将真正的活跃的热点数据页从LRU列表中移出导致InnoDB存储引擎需要再次访问磁盘,为了解决这个问题,InnoDB引擎引入了另外一个参数来进一步管理LRU列表,这个参数是innodb_old_blocks_time,用于表示页读取到mid位置后需要等待多久才会被加入到LRU列表的热端。

      当数据库刚启动时,LRU列表为空,此时所有的页都放在Free列表中,当需要从缓冲池中分页时,首先从Free列表中查找是否有可用的空闲页,若有则将该页从Free列表中删除,放入到LRU列表中,否则根据LRU算法淘汰LRU列表末尾的页将该内存空间分配给新的页。我们可以通过下图所示的命令来查看LRU列表和Free列表的使用情况和运行状态:

InnoDB体系架构 内存_第4张图片

InnoDB体系架构 内存_第5张图片

      其中Free buffers表示当前Free列表中页的数量,Database pages表示LRU列表中页的数量。在LRU列表中的页被修改后,称该页为脏页,即缓冲池中的页和磁盘上的页的数据不一致,此时会通过CHECKPOINT机制将脏页刷新回磁盘而Flush列表中的页即为脏页列表。需要注意的是脏页既存在于LRU列表中也存在于Flush列表中,LRU列表用来管理缓冲池中页的可用性,Flush列表用来管理将页刷新回磁盘,二者互不影响。

3.重做日志缓冲

      InnoDB存储引擎首先将重做日志信息先放入到这个缓冲区,然后按一定频率将其刷新到重做日志,重做日志缓冲默认大小为8M,一般情况下每一秒钟会将重做日志刷新到重做日志文件。以下三种情况重做日志缓冲中的内容会刷新到外部磁盘的重做日志文件中:

            1.Master Thread每一秒将重做日志缓冲刷新到重做日志文件;

            2.每个事务提交时会将重做日志缓冲刷新到重做日志文件;

            3.当重做日志缓冲池的剩余空间小于1/2时,重做日志缓冲刷新到重做日志文件。

4.额外的内存池

      在InnoDB存储引擎中,对内存的管理是通过一种称为内存堆的方式进行的,在对一些数据结构本身的内存进行分配时需要从额外的内存池中进行申请,当该区域的内存不够时,会从缓冲池中进行申请。

 

你可能感兴趣的:(mysql数据库,InnoDB存储引擎)