理解Go协程与并发

协程

Go语言里创建一个协程很简单,使用go关键字就可以让一个普通方法协程化:

package main

import (
    "fmt"
    "time"
)

func main(){
    fmt.Println("run in main coroutine.")

    for i:=0; i<10; i++ {
        go func(i int) {
            fmt.Printf("run in child coroutine %d.\n", i)
        }(i)
    }

    //防止子协程还没有结束主协程就退出了
    time.Sleep(time.Second * 1)
}

下面这些概念可能不太好理解,需要慢慢理解。可以先跳过,回头再来看。

概念:

  1. 协程可以理解为纯用户态的线程,其通过协作而不是抢占来进行切换。相对于进程或者线程,协程所有的操作都可以在用户态完成,创建和切换的消耗更低。
  2. 一个进程内部可以运行多个线程,而每个线程又可以运行很多协程。线程要负责对协程进行调度,保证每个协程都有机会得到执行。当一个协程睡眠时,它要将线程的运行权让给其它的协程来运行,而不能持续霸占这个线程。同一个线程内部最多只会有一个协程正在运行。
  3. 协程可以简化为三个状态:运行态就绪态休眠态。同一个线程中最多只会存在一个处于运行态的协程。就绪态协程是指那些具备了运行能力但是还没有得到运行机会的协程,它们随时会被调度到运行态;休眠态的协程还不具备运行能力,它们是在等待某些条件的发生,比如 IO 操作的完成、睡眠时间的结束等。
  4. 子协程的异常退出会将异常传播到主协程,直接会导致主协程也跟着挂掉。

协程一般用 TCP/HTTP/RPC服务、消息推送系统、聊天系统等。使用协程,我们可以很方便的搭建一个支持高并发的TCP或HTTP服务端。

通道

通道的英文是Channels,简称chan。什么时候要用到通道呢?可以先简单的理解为:协程在需要协作通信的时候就需要用通道。

在GO里,不同的并行协程之间交流的方式有两种,一种是通过共享变量,另一种是通过通道。Go 语言鼓励使用通道的形式来交流。

举个简单的例子,我们使用协程实现并发调用远程接口,最终我们需要把每个协程请求回来的数据进行汇总一起返回,这个时候就用到通道了。

创建通道

创建通道(channel)只能使用make函数:

c := make(chan int)

通道是区分类型的,如这里的int

Go 语言为通道的读写设计了特殊的箭头语法糖 <-,让我们使用通道时非常方便。把箭头写在通道变量的右边就是写通道,把箭头写在通道的左边就是读通道。一次只能读写一个元素。

c := make(chan bool)
c <- true //写入
<- c //读取

缓冲通道

上面我们介绍了默认的非缓存类型的channel,不过Go也允许指定channel的缓冲大小,很简单,就是channel可以存储多少元素:

c := make(chan int, value)

value = 0 时,通道是无缓冲阻塞读写的,等价于make(chan int);当value > 0 时,通道有缓冲、是非阻塞的,直到写满 value 个元素才阻塞写入。具体说明下:

非缓冲通道
无论是发送操作还是接收操作,一开始执行就会被阻塞,直到配对的操作也开始执行才会继续传递。由此可见,非缓冲通道是在用同步的方式传递数据。也就是说,只有收发双方对接上了,数据才会被传递。数据是直接从发送方复制到接收方的,中间并不会用非缓冲通道做中转。

缓冲通道
缓冲通道可以理解为消息队列,在有容量的时候,发送和接收是不会互相依赖的。用异步的方式传递数据。

下面我们用一个例子来理解一下:

package main

import "fmt"

func main() {
    var c = make(chan int, 0)
    var a string

    go func() {
        a = "hello world"
        <-c
    }()

    c <- 0
    fmt.Println(a)
}

这个例子输出的一定是hello world。但是如果你把通道的容量由0改为大于0的数字,输出结果就不一定是hello world了,很可能是空。为什么?

当通道是无缓冲通道时,执行到c <- 0,通道满了,写操作会被阻塞住,直到执行<-c解除阻塞,后面的语句接着执行。

要是改成非阻塞通道,执行到c <- 0,发现还能写入,主协程就不会阻塞了,但这时候输出的是空字符串还是hello world,取决于是子协程和主协程哪个运行的速度快。

通道作为容器,它可以像切片一样,使用 cap()len() 全局函数获得通道的容量和当前内部的元素个数。

模拟消息队列

上一节"协程"的例子里,我们在主协程里加了个time.Sleep(),目的是防止子协程还没有结束主协程就退出了。但是对于实际生活的大多数场景来说,1秒是不够的,并且大部分时候我们都无法预知for循环内代码运行时间的长短。这时候就不能使用time.Sleep() 来完成等待操作了。下面我们用通道来改写:

package main

import (
    "fmt"
)

func main() {
    fmt.Println("run in main coroutine.")

    count := 10
    c := make(chan bool, count)

    for i := 0; i < count; i++ {
        go func(i int) {
            fmt.Printf("run in child coroutine %d.\n", i)
            c <- true
        }(i)
    }

    for i := 0; i < count; i++ {
        <-c
    }
}

单向通道

默认的通道是支持读写的,我们可以定义单向通道:

//只读
var readOnlyChannel = make(<-chan int)

//只写
var writeOnlyChannel = make(chan<- int)

下面是一个示例,我们模拟消息队列的消费者、生产者:

package main

import (
    "fmt"
    "time"
)

func Producer(c chan<- int) {
    for i := 0; i < 10; i++ {
        c <- i
    }
}

func Consumer1(c <-chan int) {
    for m := range c {
        fmt.Printf("oh, I get luckly num: %v\n", m)
    }
}

func Consumer2(c <-chan int) {
    for m := range c {
        fmt.Printf("oh, I get luckly num too: %v\n", m)
    }
}

func main() {
    c := make(chan int, 2)

    go Consumer1(c)
    go Consumer2(c)

    Producer(c)

    time.Sleep(time.Second)
}

对于生产者,我们希望通道是只写属性,而对于消费者则是只读属性,这样避免对通道进行错误的操作。当然,如果你将本例里消费者、生产者的通道单向属性去掉也是可以的,没什么问题:

func Producer(c chan int) {}
func Consumer1(c chan int) {}
func Consumer2(c chan int) {}

事实上 channel 只读或只写都没有意义,所谓的单向 channel 其实只是方法里声明时用,如果后续代码里,向本来用于读channel里写入了数据,编译器会提示错误。

关闭通道

读取一个已经关闭的通道会立即返回通道类型的零值,而写一个已经关闭的通道会抛异常。如果通道里的元素是整型的,读操作是不能通过返回值来确定通道是否关闭的。

1、如何安全的读通道,确保不是读取的已关闭通道的零值
答案是使用for...range语法。当通道为空时,循环会阻塞;当通道关闭,循环会停止。通过循环停止,我们可以认为通道已经关闭。示例:

package main

import "fmt"

func main() {
    var c = make(chan int, 3)

    //子协程写
    go func() {
        c <- 1
        close(c)
    }()

    //直接读取通道,存在不知道子协程是否已关闭的情况
    //fmt.Println(<-c)
    //fmt.Println(<-c)

    //主协程读取:使用for...range安全的读取
    for value := range c {
        fmt.Println(value)
    }
}

输出:

1

2、如何安全的写通道,确保不会写入已关闭的通道?
Go 语言并不存在一个内置函数可以判断出通道是否已经被关闭。确保通道写安全的最好方式是由负责写通道的协程自己来关闭通道,读通道的协程不要去关闭通道。

但是这个方法只能解决单写多读的场景。如果遇到多写单读的情况就有问题了:无法知道其它写协程什么时候写完,那么也就不能确定什么时候关闭通道。这个时候就得额外使用一个通道专门做这个事情。

我们可以使用内置的 sync.WaitGroup,它使用计数来等待指定事件完成:

package main

import (
    "fmt"
    "sync"
    "time"
)

func main() {

    var ch = make(chan int, 8)

    //写协程
    var wg = new(sync.WaitGroup)

    for i := 1; i <= 4; i++ {
        wg.Add(1)
        go func(num int, ch chan int, wg *sync.WaitGroup) {
            defer wg.Done()
            ch <- num
            ch <- num * 10
        }(i, ch, wg)
    }

    //读
    go func(ch chan int) {
        for num := range ch {
            fmt.Println(num)
        }
    }(ch)

    //Wait阻塞等待所有的写通道协程结束,待计数值变成零,Wait才会返回
    wg.Wait()

    //安全的关闭通道
    close(ch)

    //防止读取通道的协程还没有完毕
    time.Sleep(time.Second)

    fmt.Println("finish")
}

输出:


3
30
2
20
1
10
4
40
finish

多路通道

有时候还会遇到多个生产者,只要有一个生产者就绪,消费者就可以进行消费的情况。这个时候可以使用go语言提供的select 语句,它可以同时管理多个通道读写,如果所有通道都不能读写,它就整体阻塞,只要有一个通道可以读写,它就会继续。示例:

package main

import (
    "fmt"
    "time"
)

func main() {

    var ch1 = make(chan int)
    var ch2 = make(chan int)

    fmt.Println(time.Now().Format("15:04:05"))

    go func(ch chan int) {
        time.Sleep(time.Second)
        ch <- 1
    }(ch1)

    go func(ch chan int) {
        time.Sleep(time.Second * 2)
        ch <- 2
    }(ch2)

    for {
        select {
            case v := <-ch1:
                fmt.Println(time.Now().Format("15:04:05") + ":来自ch1:", v)
            case v := <-ch2:
                fmt.Println(time.Now().Format("15:04:05") + ":来自ch2:", v)
            //default:
                //fmt.Println("channel is empty !")
        }
    }
}

输出:

13:39:56
13:39:57:来自ch1: 1
13:39:58:来自ch2: 2
fatal error: all goroutines are asleep - deadlock!

默认select处于阻塞状态,1s后,子协程1完成写入,主协程读出了数据;接着子协程2完成写入,主协程读出了数据;接着主协程挂掉了,原因是主协程发现在等一个永远不会来的数据,这显然是没有结果的,干脆就直接退出了。

如果把注释的部分打开,那么程序在打印出来自ch1、ch2的数据后,就会一直执行default里面的程序。这个时候程序不会退出。原因是当 select 语句所有通道都不可读写时,如果定义了 default 分支,那就会执行 default 分支逻辑。

注:select{}代码块是一个没有任何caseselect,它会一直阻塞。

Chan的应用场景

golang中chan的应用场景总结
https://github.com/nange/blog/issues/9

Go语言之Channels实际应用
https://www.s0nnet.com/archives/go-channels-practice

  • 消息队列
  • 并发请求
  • 模拟锁的功能
  • 模拟sync.WaitGroup
  • 并行计算

通道原理部分可以根据文末给出的参考链接《快学 Go 语言》第 12 课 —— 通道去查看。

并发锁

互斥所

go语言里的map是线程不安全的:

package main

import "fmt"

func write(d map[string]string) {
    d["name"] = "yujc"
}

func read(d map[string]string) {
    fmt.Println(d["name"])
}

func main() {
    d := map[string]string{}
    go read(d)
    write(d)
}

Go 语言内置了数据结构竞态检查工具来帮我们检查程序中是否存在线程不安全的代码,只要在运行的时候加上-race参数即可:

$ go run -race main.go 
==================
WARNING: DATA RACE
Read at 0x00c0000a8180 by goroutine 6:

...

yujc
Found 2 data race(s)
exit status 66

可以看出,上面的代码存在安全隐患。

我们可以使用sync.Mutex来保护map,原理是在每次读写操作之前使用互斥锁进行保护,防止其他线程同时操作:

package main

import (
    "fmt"
    "sync"
)

type SafeDict struct {
    data map[string]string
    mux  *sync.Mutex
}

func NewSafeDict(data map[string]string) *SafeDict {
    return &SafeDict{
        data: data,
        mux:  &sync.Mutex{},
    }
}

func (d *SafeDict) Get(key string) string {
    d.mux.Lock()
    defer d.mux.Unlock()
    return d.data[key]
}

func (d *SafeDict) Set(key string, value string) {
    d.mux.Lock()
    defer d.mux.Unlock()
    d.data[key] = value
}

func main(){
    dict := NewSafeDict(map[string]string{})

    go func(dict *SafeDict) {
        fmt.Println(dict.Get("name"))
    }(dict)

    dict.Set("name", "yujc")
}

运行检测:

$ go run -race main.go 
yujc

上面的代码如果不使用-race运行,不一定会有结果,取决于主协程、子协程哪个先运行。

注意:sync.Mutex 是一个结构体对象,这个对象在使用的过程中要避免被浅拷贝,否则起不到保护作用。应尽量使用它的指针类型。

上面的代码里我们多处使用了d.mux.Lock(),能否简化成d.Lock()呢?答案是可以的。我们知道,结构体可以自动继承匿名内部结构体的所有方法:

type SafeDict struct {
    data map[string]string
    *sync.Mutex
}

func NewSafeDict(data map[string]string) *SafeDict {
    return &SafeDict{data, &sync.Mutex{}}
}

func (d *SafeDict) Get(key string) string {
    d.Lock()
    defer d.Unlock()
    return d.data[key]
}

这样就完成了简化。

读写锁

对于读多写少的场景,可以使用读写锁代替互斥锁,可以提高性能。

读写锁提供了下面4个方法:

  • Lock() 写加锁
  • Unlock() 写释放锁
  • RLock() 读加锁
  • RUnlock() 读释放锁

写锁排它锁,加写锁时会阻塞其它协程再加读锁写锁读锁共享锁,加读锁还可以允许其它协程再加读锁,但是会阻塞加写锁读写锁在写并发高的情况下性能退化为普通的互斥锁

我们把上节中的互斥锁换成读写锁:

package main

import (
    "fmt"
    "sync"
)

type SafeDict struct {
    data map[string]string
    *sync.RWMutex
}

func NewSafeDict(data map[string]string) *SafeDict {
    return &SafeDict{data, &sync.RWMutex{}}
}

func (d *SafeDict) Get(key string) string {
    d.RLock()
    defer d.RUnlock()
    return d.data[key]
}

func (d *SafeDict) Set(key string, value string) {
    d.Lock()
    defer d.Unlock()
    d.data[key] = value
}

func main(){
    dict := NewSafeDict(map[string]string{})

    go func(dict *SafeDict) {
        fmt.Println(dict.Get("name"))
    }(dict)

    dict.Set("name", "yujc")
}

改完后,使用竞态检测工具检测还是能通过的。

参考

1、make(chan int) 和 make(chan int, 1) 的区别
https://www.jianshu.com/p/f12e1766c19f
2、channel
https://www.jianshu.com/p/4d97dc032730
3、《快学 Go 语言》第 12 课 —— 通道
https://mp.weixin.qq.com/s?__biz=MzI0MzQyMTYzOQ==&mid=2247484601&idx=1&sn=97c0de2acc3127c9e913b6338fa65737
4、《快学 Go 语言》第 13 课 —— 并发与安全
https://mp.weixin.qq.com/s?__biz=MzI0MzQyMTYzOQ==&mid=2247484683&idx=1&sn=966cb818f034ffd4538eae7a61cd0c58

你可能感兴趣的:(理解Go协程与并发)