Go sync.WaitGroup

问题

当main goroutine为了等待work goroutine都运行完毕，不得不在程序末尾使用time.Sleep()来休眠一段时间，等待work goroutine充分运行。

$ vim ./test/goroutine_test.go

package test

import (
    "fmt"
    "testing"
    "time"
)

func TestGoRoutine(t *testing.T) {
    for i := 0; i < 10; i++ {
        go fmt.Println(i)
    }
    time.Sleep(time.Second)
}

$ go test -v -run TestGoRoutine goroutine_test.go
=== RUN   TestGoRoutine
9
3
1
2
4
5
6
7
8
0
--- PASS: TestGoRoutine (1.00s)
PASS
ok      command-line-arguments  1.291s

但对于实际应用中，休眠1秒是完全不够的，同时大部分时间都无法预知for循环内代码运行时间的长短，此时就不能使用time.Sleep()来完成等待操作。

可以使用管道来完成上述操作

func TestGoRoutine(t *testing.T) {
    count := 10
    ch := make(chan bool, count)
    for i := 0; i < count; i++ {
        go func(i int) {
            fmt.Println(i)
            ch <- true
        }(i)
    }
    for i := 0; i < count; i++ {
        <-ch
    }
}

$ go test -v -run TestGoRoutine goroutine_test.go
=== RUN   TestGoRoutine
9
0
5
6
7
8
2
1
4
3
--- PASS: TestGoRoutine (0.00s)
PASS
ok      command-line-arguments  0.304s

使用管道可以达到目的，但有些大材小用，因为管道被设计出来不仅仅只是在这里做简单的同步处理的，因此这里使用管道实际上是不合适的。假如有上万、上十万、上百万的循环，也要申请同样数量大小的管道，对内存会是一个不小的开销。

对于这种情况，Golang中有一种工具sync.WaitGroup能更加方便地帮助达到目的。

sync.WaitGroup

Golang中除了使用Channel通道和Mutex互斥锁实现两个并发程序之间的同步外，还可以通过WaitGroup等待组实现多个任务的同步，WaitGroup可以保证在并发环境中完成指定数量的任务。

WaitGroup在Golang中用于goroutine同步，解决同步阻塞等外的问题。

通俗来讲goroutine分为两类角色，一种gorouine作为一个worker小弟，老老实实的干活。另一种goroutine作为master管理者来监督小弟干活，当然master自身也是一个worker。

当有很多worker干活时，master没事干歇着，但同时master又希望得到一个通知，了解所有worker们什么时候干完。

从程序开发角度来看，就是维护一个worker总数和一个channel，每个worker干完就向channel发送一个空message。master阻塞在channel的监听上，来一个message就说明有一个worker干完活了，记录下有多少message，message和worker总数一致则说明全干完活。master就可以关闭channel，验收worker的工作成果。

WaitGroup是指等待（Wait）一系列执行（Group）完成后才会继续向下执行
WaitGroup能一直等到所有的work goroutine执行完毕，同时阻塞main goroutine的执行，直到所有的goroutine执行完成。
WaitGroup类似发布订阅，只不过订阅者接收到的不是消息，而是一种事件信号。

计数器

WaitGroup内部拥有一个计数器，最初从0开始。

type WaitGroup struct{
  noCopy noCopy
  state1 [3]byte
}

WaitGroup

Counter：Worker计数器
master gortouine调用WaitGroup.Add(delta int)时会增加delta，调用WaitGroup.Done()时会减少1。
Waiter：Waiter计数器
调用WaitGroup.Wait()时Waiter计数器加1，worker goroutine计数器降低到0时，会重置Waiter计数器。
Sema：信号量
用于阻塞master goroutine，调用WaitGroup.Wait()时会通过runtime_Semacquire获取信号量。降低Waiter计数器时，通过runtime_Semrelease释放信号量。

方法

WaitGroup拥有三个方法分别是Add()、Done()、Wait()用来控制计数器的数量

Wai't'Group

Add()将计数器设置为n，用于增加或减少worker goroutine的数量。

func (wg *WaitGroup) Add(delta int)

Done()每次会将计数器减少1

func (wg *WaitGroup) Done()

WaitGroup.Done()和WaitGroup.Add(-1)完全等价

Wait()会阻塞代码的运行，直到计数器的值减少为0。

func (wg *WaitGroup) Wait()

使用方法

master goroutine通过调用WaitGroup.Add(delta int)来设置worker goroutine的个数，然后创建work goroutine。
worker goroutine执行结束后需调用WaitGroup.Done()
master goroutine调用WaitGroup.Wait()且被block阻塞，直到所有的worker goroutine全部执行结束后返回。

例如：

$ vim ./test/sync_test.go

package test

import (
    "fmt"
    "sync"
    "testing"
)

func TestWaitGroup(t *testing.T) {
    count := 10
    //添加goroutine数量
    wg := sync.WaitGroup{}
    wg.Add(count)
    //循环模拟并发
    for i := 0; i < count; i++ {
        go func(i int) {
            fmt.Println(i)
            wg.Done() //设置gorooutine为-1
        }(i)
    }
    //执行main goroutine阻塞，直到所有WaitGroup数量为0。
    wg.Wait()
}

$ go test -v -run TestWaitGroup sync_test.go
=== RUN   TestWaitGroup
9
4
5
6
7
8
2
3
1
0
--- PASS: TestWaitGroup (0.00s)
PASS
ok      command-line-arguments  0.294s

注意

WaitGroup对象不是一个引用类型，函数传值时需使用地址（地址传值）。
WaitGroup的计数器不能为负数，不能使用Add()给WaitGroup对象设置一个负值。

应用

需要一个用户的画像服务，当一个请求到来时需要

从请求中解析出用户ID和用户画像维度参数
根据用户ID从五个服务比如数据库、存储、RPC等拉取不同维度的数据
将读取到的数据进行整合返回给调用方

假如每个服务的响应时间是20ms到50ms，如果顺序调用服务读取数据不考虑数据整合消耗的时间，服务端整体的响应时间将会在100ms到250ms。先不说业务能不能接受，响应时间显然存在很大的优化空间。最直接的优化方向是取数逻辑总时间应该是单个服务最大消耗时间。

func TestTask(t *testing.T) {
    var wg sync.WaitGroup

    for _,task := range tasks{
        task := task
        wg.Add(1)

        go func(){
            defer wg.Done()
            task()
        }()
    }

    wg.Wait()
}

使用注意

WaitGroup.Done()必须在所有WaitGroup.Add()之后执行，要保证两个函数都在master goroutine中调用。
WaitGroup.Done()在worker goroutine中调用，尤其要保证调用一次，不能因为panic或任何原因导致没有执行，因此建议使用defer WaitGroup.Done()。
WaitGroup.Done()和WaitGroup.Wait()在时序上没有先后顺序

task := task

由于Golang对切片遍历时runtime会将tasks[i]拷贝到task的内存地址中，下标i会变化，而task的内存地址是不会改变的。如果不做此次赋值操作，所有的goroutine可能读取到的都是最后一个task。

例如：

func TestTask(t *testing.T) {
    tasks := []func(){
        func() { fmt.Printf("task1 ") },
        func() { fmt.Printf("task2 ") },
    }

    for index, task := range tasks {
        task()
        fmt.Printf("%v %v\n", unsafe.Pointer(&task), unsafe.Pointer(&tasks[index]))
    }
}

$ go test -v -run TestTask sync_test.go
=== RUN   TestTask
task1 0xc000006040 0xc00003c500
task2 0xc000006040 0xc00003c508
--- PASS: TestTask (0.00s)
PASS
ok      command-line-arguments  0.296s

执行结果说明

遍历时数据的内存地址不变unsafe.Pointer(&task)
遍历时通过下标获取数据时内存地址不同unsafe.Pointer(&tasks[index])

func TestTask(t *testing.T) {
    tasks := []func(){
        func() { fmt.Printf("task1 ") },
        func() { fmt.Printf("task2 ") },
    }

    for index, task := range tasks {
        task := task
        task()
        fmt.Printf("%v %v\n", unsafe.Pointer(&task), unsafe.Pointer(&tasks[index]))
    }
}

$ go test -v -run TestTask sync_test.go
=== RUN   TestTask
task1 0xc0000c0030 0xc0000884f0
task2 0xc0000c0038 0xc0000884f8
--- PASS: TestTask (0.00s)
PASS
ok      command-line-arguments  0.320s

执行结果说明

遍历内部创建的局部变量，即使名称相同，内存地址也不会复用。
遍历时数据的内存地址不同unsafe.Pointer(&task)
遍历时通过下标获取数据时内存地址不同unsafe.Pointer(&tasks[index])

Go sync.WaitGroup

问题

sync.WaitGroup

计数器

方法

注意

应用

你可能感兴趣的:(Go sync.WaitGroup)