GO运行组件浅析-内存分配

概念介绍

page

大小为8Kb的内存块

span

由多个地址连续的页(page)组成的大块内存.分配器按照页数来区分不同大小的span.

但是span大小不是固定不变的,可能发生裁剪和合并操作:

  • 如果获取闲置span的时候没有找到大小合适的,就会找到一个更大的span,然后对其做裁剪操作,多余部分构成新的span被放回管理数组.
  • 如果有地址相邻的空闲span,分配器就会试图合并来构建更大的内存块

object

将span按照特定大小切分成多个小块,每个小块可以存储一个对象(object)

对象按照8字节的倍数被划分为若干种,大小为24的对象可以存储17-24字节的对象,这种方式虽然会造成一定的内存碎片,但是分配器因此只需要处理若干规格(size class)的小块内存,方便回收和复用

对象总的来说分为三类:微小对象(Tiny, 小于16字节),小对象(Small, 不超过32KB),大对象(Large,超过32KB). 其中小对象还可以细分为约70种规格

管理组件

go的分配器直接借鉴了tcmalloc的架构,分为三个组件:cache, central, heap

cache

每一个工作线程都会绑定一个缓存(mcache). mcache本质上是一个span数组, 对于每一个规格, 都提供了对应的span1. 由于工作线程同时只会执行一个goroutine, 因此在cache上的分配可以是无锁的,从而大大提高了性能.

GO运行组件浅析-内存分配_第1张图片

central

central是线程共享的备用span资源. 当cache中对应规格的span没有剩余空间的时候, 会从central中获取新的span. 在结构上, 如下图所示, central为每一种规格都维护两个span双向链表,一个是non empty list, 存储在其中的span至少可用于分配一个对象. 而empty list中的span则没有可用空间.

GO运行组件浅析-内存分配_第2张图片

heap

管理闲置span, 需要的时候会向操作系统申请新的内存

全图景

GO运行组件浅析-内存分配_第3张图片

内存分配流程

基本策略

在详细讨论每一种对象分配策略之前, 有必要了解一下宏观上的策略:

  1. 每次都从操作系统中分配一个大块内存(比如1MB), 减少系统调用
  2. 将大块内存按照特定规格大小切割成小块, 组成链表
  3. 为对象分配内存的时候只需要从链表中提取一块即可
  4. 回收内存的时候, 将该内存重新归还到链表以复用2
  5. 如果闲置内存过多, 会尝试归还部分内存来降低整体开销

微小对象分配(tiny allocation)

引入微小对象的主要目的是处理小字符串和独立转义变量(standalone escaping variables).

微小对象的原理在于将多个微小对象组合在一个object里面3, 从而节省内存.

当需要分配的对象小于16字节的时候会按照下面的流程执行:

  1. 在cache中找对应的tiny对象字段(tiny object)
  2. 将tiny object剩余大小基于新对象大小进行对齐(也就是新对象占用空间为2, 4, 8, 16四种)
  3. 如果tiny object剩余空间足够, 那么就分配并返回

如果tiny object大小不足

  1. 从cache的对应规格的span中获取一个新的object(16字节)

如果span中没有闲置object

  1. 从central对应规格的span list中找到一个有闲置空间的span
  2. 获取整个span, 从而分摊加锁访问central的时间成本

如果central中没有对应规格的有空余空间的span

  1. 从heap中获取一组页(pages)来切分为span

如果heap中为空或者没有足够大小的页

  1. 从OS中分配至少1MB的页
  2. 分配足够大的页来分摊分配这一系统调用的成本

小对象分配(small allocation)

小对象和微小对象处理流程类似, 但是不需要访问cache的tiny object字段.

对于小对象(小于32kb)的分配,GO会按照下面的流程分配内存

  1. 计算待分配对象的对应规格(size class)

  2. 从cache中找到对应规格的span

  3. 检查span是否有空余空间,有的话插入,完成分配过程

    GO运行组件浅析-内存分配_第4张图片
  4. 如果没有空余空间,那么从central的non empty list中获取一个span, 如下图所示

    GO运行组件浅析-内存分配_第5张图片
  5. 如果central的non empty list是空的, 那么会从heap的free/free large中获取, 如下图所示

    GO运行组件浅析-内存分配_第6张图片
  6. 如果heap没有大小合适的span, 那么会向操作系统申请新的内存块

    heap每次会申请一个大的内存块称之为arena, 对于64位架构,该内存块大小为64Mb, 对于其他架构, 大小为4Mb. arena会映射spans的内存页

    GO运行组件浅析-内存分配_第7张图片

对象内存释放流程

对于微小对象, 小对象而言, 在释放内存的时候会按照下面的流程执行

  1. 将标记可回收的对象(object)交还给所属span
  2. 该span会放回central, 从而允许其他cache获取使用
  3. 如果span回收了所有object, 则交还给heap, 以便重新切分复用
  4. 定期扫描heap 中长时间闲置的span, 释放内存4

大对象分配

对于超过32Kb大小的对象, go不会用cache管理. 而是会直接先计算需要的页大小, 然后直接从heap中获取

具体计算细节可以参考这里

GO运行组件浅析-内存分配_第8张图片

参考

GO语言学习笔记-内存分配

Go: Memory Management and Allocation

TCMalloc

GO Memory Management

A visual guide to Go Memory Allocator from scratch (Golang)

Visualizing memory management in Golang

脚注


  1. 准确来说,对于每一个规格都包含了两个span, 一个存储不包含指针的对象,一个存储包含指针的对象. 从而方便垃圾回收 ↩︎

  2. 注意内存分配器不会主动回收, 是由垃圾回收器完成清理后, 触发内存分配器回收操作 ↩︎

  3. 因此存储的微小对象不能包含指针,否则GC扫描不出来. ↩︎

  4. 某个时间段可能某个规格的object需求量激增. 在需求过后, 大量被切割为该规格的span就会被闲置. 归还给heap允许被其他需求获取, 重新切分 ↩︎

你可能感兴趣的:(go,go内部探秘)