gol内存逃逸

总结

  • 逃逸的指针变量本身也是分配在堆空间,故函数可以返回局部变量的地址。此时的局部变量相当于局部指针变量,逃逸时,指针变量本身也是分配在堆空间,所以能返回它的地址。
  • 栈空间的内存由编译器管理,分配释放速度很快。堆空间,由gc管理,频繁的gc会占用系统较大的开销,stop the world
  • 逃逸分析是编译器在静态编译时完成的。
  • 切片变量本身逃逸了,那它底层的data区域也会逃逸。即使切片长度很小。
  • 切片变量本身没逃逸,那一般情况它的data区域也在栈上,若长度太长,则data区域会分配到堆上,但切片变量本身还是在栈上。

如何确定内存逃逸?

go run -gcflags '-m -l' main.go

注意:上述命令只在编译器接入判断是否逃逸处有输出。
有时候栈空间比堆空间地址还小,不知道为啥。

内存逃逸的例子

func main()  {
    a := 1
    _ = a
}

// 无输出
func main()  {
    a := 1
    fmt.Printf("%p\n", &a)
    fmt.Println(a)

    b := 2
    fmt.Printf("%p\n", &b)
    fmt.Println(b)

    c := 3
    fmt.Printf("%p\n", &c)
    fmt.Println(c)

    d := 4
    fmt.Printf("%p\n", &d)
    fmt.Println(d)
}

// 输出
./main.go:10:2: moved to heap: a
./main.go:14:2: moved to heap: b
./main.go:18:2: moved to heap: c
./main.go:22:2: moved to heap: d
./main.go:11:12: ... argument does not escape
./main.go:12:13: ... argument does not escape
./main.go:12:13: a escapes to heap
./main.go:15:12: ... argument does not escape
./main.go:16:13: ... argument does not escape
./main.go:16:13: b escapes to heap
./main.go:19:12: ... argument does not escape
./main.go:20:13: ... argument does not escape
./main.go:20:13: c escapes to heap
./main.go:23:12: ... argument does not escape
./main.go:24:13: ... argument does not escape
./main.go:24:13: d escapes to heap
0xc000012080
1
0xc000012088
2
0xc0000120a0
3
0xc0000120a8
4

fmt.Printf函数abc赋值给interface{},造成逃逸,abc地址在堆空间,如图正增长,印证了在堆上。对比下面:

func main()  {
    a := 1
    println(&a)
    println(a)

    b := 2
    println(&b)
    println(b)

    c := 3
    println(&c)
    println(c)

    d := 4
    println(&d)
    println(d)
}

// 输出
0xc00002e768
1
0xc00002e760
2
0xc00002e758
3
0xc00002e750
4

println不会触发内存逃逸,abc分配在栈空间,地址从高到低增长印证了这点。

四个指针没逃逸的情况:

func main()  {
    a := new(int)
    println(&a)
    println(a)

    println("======")
    b := new(int)
    println(&b)
    println(b)

    println("======")
    c := new(int)
    println(&c)
    println(c)

    println("======")
    d := new(int)
    println(&d)
    println(d)
}

// 输出
./main.go:32:10: new(int) does not escape
./main.go:39:10: new(int) does not escape
./main.go:46:10: new(int) does not escape
./main.go:53:10: new(int) does not escape
0xc00002e768
0xc00002e740
======
0xc00002e760
0xc00002e738
======
0xc00002e758
0xc00002e730
======
0xc00002e750
0xc00002e748

abcd指针变量本身和其所指的内存区域,没有逃逸,都是分配在栈空间,打印的地址从大到小为连续区域印证了这点。
内存分配如图:
gol内存逃逸_第1张图片

四个指针有逃逸的情况

func main() {
    a := new(int)
    fmt.Printf("%p\n", &a)
    fmt.Println(a)
    println("======")

    b := new(int)
    fmt.Printf("%p\n", &b)
    fmt.Println(b)

    println("======")
    c := new(int)
    fmt.Printf("%p\n", &c)
    fmt.Println(c)
    println("======")

    d := new(int)
    fmt.Printf("%p\n", &d)
    fmt.Println(d)

    println("======")
    f := new(int)
    println(&f)
    println(f)
}

//输出
0xc00000e028
0xc000012080
======
0xc00000e038
0xc000012088
======
0xc00000e040
0xc0000120a0
======
0xc00000e048
0xc0000120a8
======
0xc000058f38
0xc000058f30

逃逸情况下,abcd指针变量本身和其所指的内存区域,都是分配在堆空间,打印的地址从小到大为连续区域印证了这点。f指针变量和其所指的内存区域分配在栈空间,其地址高于堆区域地址印证了这点。
逃逸的指针变量本身也是分配在堆空间,故函数可以返回局部指针变量
内存分配图如下:
gol内存逃逸_第2张图片


func main()  {
    a := new(int)
    _ = a
}

// 输出
./main.go:8:10: main new(int) does not escape

即使是new的变量,没逃逸时,也是分配在栈

  • println函数不会触发逃逸,而fmt.Printf会,因为它的函数参数是interface{}类型
  • 注意: 上面例子,a是指针变量分配在栈空间,指向的int存储单元在下一个字节(也是在栈空间)。
  • 栈空间在高地址为,从高往低分配。

这要是在C++中这么写,是个很典型的错误:返回局部变量的地址,该地址的内容在函数退出后会被自动释放,因为是在栈上的。

那么go语言的局部变量到底是在栈上还是堆上呢?go语言编译器会做逃逸分析(escape analysis),分析局部变量的作用域是否逃出函数的作用域,要是没有,那么就放在栈上;要是变量的作用域超出了函数的作用域,那么就自动放在堆上。

测试观察g的地址变化

func main {
    var g *int
    println(&g)
    println(g)
    g = new(int)
    println(&g)
    println(g)
    g = new(int)
    println(&g)
    println(g)
    g = new(int)
    fmt.Println(&g)
    fmt.Println(g)
}

没有最后两行的话,没逃逸,g与g指向的内存都在栈区,加了则都在堆区。

出现逃逸的场景

package main

type Student struct {
 Name interface{}
}

func main()  {
 stu := new(Student)
 stu.Name = "tom"

}

interface{} 赋值,会发生逃逸,优化方案是将类型设置为固定类型,例如:string

package main

type Student struct {
 Name string
}

func GetStudent() *Student {
 stu := new(Student)
 stu.Name = "tom"
 return stu
}

func main() {
 GetStudent()
}

返回(局部变量的地址)指针类型,会发生逃逸,优化方案视情况而定。
函数传递指针和传值哪个效率高吗?我们知道传递指针可以减少底层值的拷贝,可以提高效率,但是如果拷贝的数据量小,由于指针传递会产生逃逸,可能会使用堆,也可能会增加 GC 的负担,所以传递指针不一定是高效的。
不要盲目使用变量指针作为参数,虽然减少了复制,但变量逃逸的开销可能更大。

func main()  {
    nums := make([]int, 5, 5)
    nums2 := make([]int, 5, 5)
    println(&nums)
    println(nums)
    println(&nums2)
    println(nums2)
    for i := range nums {
        nums[i] = i
        println(&nums[i])
    }
    println("======2")
    for i := range nums2 {
        nums2[i] = i
        println(&nums2[i])
    }

    println("======3")
    nums3 := make([]int, 10000, 10000)
    println(&nums3)
    println(nums3)
    for i := range nums3 {
        if i == 5 {
            break
        }
        nums3[i] = i
        println(&nums3[i])
    }
    //fmt.Println(&nums3)

}

// 输出
./main.go:8:14: make([]int, 5, 5) does not escape
./main.go:9:15: make([]int, 5, 5) does not escape
./main.go:25:15: make([]int, 10000, 10000) escapes to heap
0xc00002e758
[5/5]0xc00002e6f8
0xc00002e740
[5/5]0xc00002e6d0
0xc00002e6f8
0xc00002e700
0xc00002e708
0xc00002e710
0xc00002e718
======2
0xc00002e6d0
0xc00002e6d8
0xc00002e6e0
0xc00002e6e8
0xc00002e6f0
======3
0xc00002e728
[10000/10000]0xc000054000
0xc000054000
0xc000054008
0xc000054010
0xc000054018
0xc000054020

如上:第1、2个slice变量及其底层的data指针区域,都是分配在栈上。
第3个超大切片,slice变量本身分配在栈上,底层数据在堆上。
如果注释掉最后的fmt.Printf则第3个slice变量本身也会逃逸分配在堆上。

注意:切片data区域第1到第n个元素的地址空间都是从0往上增的,不管是在栈还是在堆上。

func main()  {
    var slice1 []int
    println(&slice1)
    println(slice1)
    fmt.Printf("%p\n", &slice1)
    println(&slice1)
    println(slice1)
    slice1 = make([]int,5,5)
    println(&slice1)
    println(slice1)
}

// 输出
./main.go:11:6: moved to heap: slice1
./main.go:14:12: ... argument does not escape
./main.go:17:15: make([]int, 5, 5) escapes to heap
0xc0000a4018
[0/0]0x0
0xc0000a4018
0xc0000a4018
[0/0]0x0
0xc0000a4018
[5/5]0xc0000aa030

切片变量本身逃逸了,那它底层的data区域也会逃逸。即使切片长度很小。
切片变量本身没逃逸,那一般情况它的data区域也在栈上,若长度太长,则data区域会分配到堆上,但切片变量本身还是在栈上。

package main

func main() {
 nums := make([]int, 10000, 10000)

 for i := range nums {
  nums[i] = i
 }
}

切片太大,会发生逃逸,优化方案尽量设置容量,如果容量实在过大那就没办法了。

map里的元素是不能取地址的。

map没逃逸时,也是分配在栈上的,变量本身及底层的数据区。

你可能感兴趣的:(golang)