Go并发编程

文章目录

    • 协程机制
    • 共享内存并发机制
      • Lock
      • WaitGroup
    • CSP并发机制
    • 多路选择和超时
    • channel的关闭和广播
    • 任务的取消
    • Context与任务取消

协程机制

Thead vs. Groutine

  • 创建时默认的 stack 的大小
    • JDK5 以后的 Java Thread stack 默认为1M
    • Groutine 的 Stack 初始化大小为2k
  • 和 KSE(Kernel Space Entity)的对应关系
    • Java Thread 是 1:1
    • Groutine 是 M:N

Go并发编程_第1张图片

GoGMP调度:

Go并发编程_第2张图片

M:系统线程

P:Go实现的协程处理器

G:协程

从图中可看出,Processor 在不同的系统线程中,每个 Processor 都挂着准备运行的协程队列。

Processor 依次运行协程队列中的协程。

这时候问题就来了,假如一个协程运行的时间特别长,把整个 Processor 都占住了,那么在队列中的协程是不是就会被延迟的很久?

在Go启动的时候,会有一个守护线程来去做一个计数,计每个 Processor 运行完成的协程的数量,当一段时间内发现,某个 Processor 完成协程的数量没有发生变化的时候,就会往这个正在运行的协程任务栈插入一个特别的标记,协程在运行的时候遇到非内联函数,就会读到这个标记,就会把自己中断下来,然后插到这个等候协程队列的队尾,切换到别的协程进行运行。

当某一个协程被系统中断了,例如说 io 需要等待的时候,为了提高整体的并发,Processor 会把自己移到另一个可使用的系统线程当中,继续执行它所挂的协程队列,当这个被中断的协程被唤醒完成之后,会把自己加入到其中某个 Processor 的队列里,会加入到全局等待队列中。

当一个协程被中断的时候,它在寄存器里的运行状态也会保存到这个协程对象里,当协程再次获得运行状态的时候,重写写入寄存器,继续运行。

话不多说,直接上代码,如何在代码里启动一个协程:

func TestGroutine(t *testing.T) {
	for i := 0; i < 10; i++ {
		// int 参数
		go func(i int) {
			fmt.Println(i)
		}(i) // 传入参数
	}
	// 有可能测试程序结束的非常快 加个等待
	time.Sleep(time.Millisecond * 50)
	/** 运行结果
	=== RUN   TestGroutine
	1
	4
	5
	2
	6
	3
	0
	8
	9
	7
	--- PASS: TestGroutine (0.05s)
	*/
}

共享内存并发机制

Lock

如果你是 Java 或者 C++ 程序员,那么以下代码非常常见,使用锁来进行并发控制(可惜我是个Phper):

lock lock = ...;
lock.lock();
try{
  // process (thread-safe)
}catch(Exception ex){
  
}finally{
  lock.unlock();
}

同样Go也提供了这样的机 package sync:

Mutex 互斥锁

RWLock 读写锁

不使用锁的情况:

func TestCounter(t *testing.T) {
	counter := 0
	for i := 0; i < 5000; i++ {
		go func(i int) {
			counter++
		}(i)
	}
	time.Sleep(time.Second * 1)
	t.Logf("counter = %d", counter)
	/** 运行结果:
	=== RUN   TestCounter
	    TestCounter: share_memory_test.go:16: counter = 4627
	--- PASS: TestCounter (1.01s)
	*/
}

可以发现结果与预期结果不一样,这是因为 conuter 变量在不同的协程里面去做自增,导致了一个并发的竞争条件,传统意义来讲就是一个不是线程安全的程序。要保证线程安全,就要对共享的内存进行锁保护。

func TestCounterThreadSafe(t *testing.T) {
	var mut sync.Mutex
	counter := 0
	for i := 0; i < 5000; i++ {
		go func(i int) {
			// defer 释放锁
			defer func() {
				mut.Unlock()
			}()
			// 加锁
			mut.Lock()
			counter++
		}(i)
	}
	time.Sleep(time.Second * 1)
	t.Logf("counter = %d", counter)
	/** 运行结果:
	=== RUN   TestCounterThreadSafe
	    TestCounterThreadSafe: share_memory_test.go:40: counter = 5000
	--- PASS: TestCounterThreadSafe (1.01s)
	*/
}

这次就得到了预期结果。

WaitGroup

等待所有协程完成,才能往下执行操作。

上面代码中,怕代码执行太快,所以加了 sleep

但我们无法控制这个 sleep 需要睡眠时间。

下面来用 WaitGroup

func TestCounterWaitGroup(t *testing.T) {
	var mut sync.Mutex
	var wg sync.WaitGroup
	counter := 0
	for i := 0; i < 5000; i++ {
		wg.Add(1) // 增加一个要等待的协程
		go func(i int) {
			// defer 释放锁
			defer func() {
				mut.Unlock()
			}()
			// 加锁
			mut.Lock()
			counter++
			wg.Done() // 一个协程完成了
		}(i)
	}
	wg.Wait() // 等待所有添加的协程完成 才继续向下运行
	t.Logf("counter = %d", counter)
	/** 运行结果:
	=== RUN   TestCounterWaitGroup
	    TestCounterWaitGroup: share_memory_test.go:66: counter = 5000
	--- PASS: TestCounterWaitGroup (0.00s)
	*/
}

CSP并发机制

有人可能会说不就是 Actor Model

Go并发编程_第3张图片

CSP vs. Actor

  • Actor 的直接通讯不同,CSP模式则是通过Channel进行通讯的,更松耦合一些。
  • Go中的channel是有容量限制并且独立于处理Groutine,而如ErlangActor模式中的mailbox容量是无限的,接收进程也总是被动地处理消息。

Channel

Go并发编程_第4张图片

GoChannel的基本机制:

  • 上图左边(非缓冲channel):

    通讯的两方必须同时在channel的两边,才能完成这次交互。任何一方不在,另一方就会被阻塞在那里等待,直到等到另一方才能完成这次交互。

  • 上图右边(缓冲channel):

    就是对这个channel设置容量,在未满的情况下,放消息的人就能放进去,如果满了,就会发生阻塞等待。

    等待拿消息的人去拿,空出来容量。反之,拿消息一样。

func service() string {
	time.Sleep(time.Millisecond * 50) // 模拟阻塞
	return "Done"
}

func otherTask() {
	fmt.Println("working on something else")
	time.Sleep(time.Millisecond * 100) // 模拟阻塞
	fmt.Println("Task is done.")
}

func TestService(t *testing.T) {
	fmt.Println(service())
	otherTask()
	/** 运行结果:
	=== RUN   TestService
	Done
	working on something else
	Task is done.
	--- PASS: TestService (0.16s)
	*/
}

由运行结果可知,完全是串行的,耗时为 0.16s

service进行改造,在调用的时候启动另外一个协程去执行,而不是阻塞当前写的协程。

func service() string {
	time.Sleep(time.Millisecond * 50) // 模拟阻塞
	return "Done"
}

func otherTask() {
	fmt.Println("working on something else")
	time.Sleep(time.Millisecond * 100) // 模拟阻塞
	fmt.Println("Task is done.")
}

func AsyncService() chan string {
	retCh := make(chan string) // 创建一个非缓冲string类型的channel
	//retCh := make(chan string, 1) // 创建一个容量为1 string类型的缓冲channel
	go func() {
		ret := service()
		fmt.Println("returned result.")
		retCh <- ret // 放入 channel
		fmt.Println("service exited.")
	}()
	return retCh
}

func TestAsyncService(t *testing.T) {
	retCh := AsyncService()
	otherTask()
	fmt.Println(<-retCh) // 从channel拿出
	/** 运行结果
	=== RUN   TestAsyncService
	working on something else
	returned result.
	Task is done.
	Done
	service exited.
	--- PASS: TestAsyncService (0.10s)
	*/
}

可以看打印的顺序,实现了一个异步返回结果,耗时 0.1s

多路选择和超时

select

  • 多渠道的选择:

    select {
    	case ret := <-retCh:
    		t.Logf("result %s", ret)
    	case ret := <-retCh2:
    		t.Logf("result %s", ret)
    	default:
    		t.Error("No one returned")
    }
    
  • 超时控制:

    select {
      case ret := <-retCh:
      	t.Logf("result %s", ret)
      case <-time.After(time.Second * 1):
    	  t.Error("time out")
    }
    

示例代码:

func service() string {
	time.Sleep(time.Millisecond * 500) // 模拟阻塞
	return "Done"
}

func AsyncService() chan string {
	retCh := make(chan string) // 创建一个非缓冲channel
	//retCh := make(chan string, 10) // 创建一个容量为10的缓冲channel
	go func() {
		ret := service()
		fmt.Println("returned result.")
		retCh <- ret // 放入 channel
		fmt.Println("service exited.")
	}()
	return retCh
}

func TestSelect(t *testing.T) {
	// 上面模拟阻塞 500ms
	select {
	case ret := <-AsyncService():
		t.Log(ret)
	case <-time.After(time.Millisecond * 100):
		t.Error("time out")
	}
	/** 运行结果:
	=== RUN   TestSelect
	    TestSelect: select_test.go:31: time out
	--- FAIL: TestSelect (0.10s)
	*/
}

channel的关闭和广播

// 生产者
func dataProducer(ch chan int, wg *sync.WaitGroup) {
	go func() {
		for i := 0; i < 10; i++ {
			ch <- i // 放入
		}
		wg.Done()
	}()
}

// 消费者
func dataReceiver(ch chan int, wg *sync.WaitGroup) {
	go func() {
		for i := 0; i < 10; i++ {
			data := <-ch // 取出
			fmt.Println(data)
		}
		wg.Done()
	}()
}

func TestCloseChannel(t *testing.T) {
	var wg sync.WaitGroup
	ch := make(chan int)
	wg.Add(1)
	dataProducer(ch, &wg)
	wg.Add(1)
	dataReceiver(ch, &wg)
	wg.Wait()
	/** 运行结果:
	=== RUN   TestCloseChannel
	0
	1
	2
	3
	4
	5
	6
	7
	8
	9
	--- PASS: TestCloseChannel (0.00s)
	*/
}

这里可以看到 dataProducer 放数据的时候放了10个,dataReceiver 也是拿了10个。

这是因为我们知道是10,但正常情况 dataReceiver 才能知道 dataProducer 放完了呢。

其一我们可以做个约定,比如 dataProducer 放入个 -1 ,当 dataReceiver 收到 -1 就退出去。

但是又出来一个新问题,如果有多个 dataReceiver 呢,dataProducer 就得知道有多少个 dataReceiver,来放入多个 -1,问题就是不知道。

channel的关闭:

  • 向关闭的 channel 发送数据,会导致 panic
  • v, ok <-ch; okbool 值,true 表示正常接受,false 表示通道关闭
  • 所有的 channel 接收者都会在 channel 关闭时,⽴立刻从阻塞等待中返回且上 述 ok 值为 false。这个⼴广播机制常被利利⽤用,进⾏行行向多个订阅者同时发送信号。 如:退出信号。

改造 dataReceiver

func dataReceiver(ch chan int, wg *sync.WaitGroup) {
	go func() {
		for {
			if data, ok := <-ch; ok { // ok 为 true
				fmt.Println(data)
			} else { // 结束循环
				break
			}
		}
		wg.Done()
	}()
}

启动多个 dataReceiver

func TestCloseChannel(t *testing.T) {
	var wg sync.WaitGroup
	ch := make(chan int)
	wg.Add(1)
	dataProducer(ch, &wg)
	wg.Add(1)
	dataReceiver(ch, &wg)
	wg.Add(1)
	dataReceiver(ch, &wg)
	wg.Wait()
	/** 运行结果:
  === RUN   TestCloseChannel
  0
  1
  2
  3
  5
  6
  7
  8
  4
  9
  --- PASS: TestCloseChannel (0.00s)
	*/
}

假如不判断 ok 呢:

func dataReceiver(ch chan int, wg *sync.WaitGroup) {
	go func() {
		for i := 0; i < 11; i++ { // 上面 dataProducer 放进去了10个
			data := <-ch
			fmt.Println(data) // 当通道被关闭 会返回一个这个通道定义类型的零值
		}
		wg.Done()
	}()
}

任务的取消

func cancel_1(cancelChan chan struct{}) {
	cancelChan <- struct{}{} // 往 channel 中放入消息
}
func cancel_2(cancelChan chan struct{}) {
	close(cancelChan)
}

func isCancelled(cancelChan chan struct{}) bool {
	select {
	case <-cancelChan: // 从 channel 中收到消息 返回true
		return true
	default:
		return false
	}
}

func TestCancel(t *testing.T) {
	cancelChan := make(chan struct{}, 0)
	for i := 0; i < 5; i++ { // 启动5个协程任务
		go func(i int, cancelChan chan struct{}) {
			for { // 每个任务一直在执行
				if isCancelled(cancelChan) { // 每次检查是否任务是否进行停止 进行停止
					break
				}
				time.Sleep(time.Millisecond * 5)
			}
			fmt.Println(i, "Cancelled")
		}(i, cancelChan)
	}
	cancel_1(cancelChan)
	time.Sleep(time.Second * 1)
	/** 运行结果:
	=== RUN   TestCancel
	4 Cancelled
	--- PASS: TestCancel (1.00s)
	*/
}

只有一个 任务被取消掉了,因为 channel 传递过去只有一个信号,而这里有5个协程,其它协程没有被取消。

而我们可以传递5个,将它们全部取消,这样的编程坏处,前面的逻辑和有多少个task进行耦合,必须事先知道有多少个task

换成第二个取消方法,因为是广播机制,所以所有协程都会收到。

func TestCancel(t *testing.T) {
	cancelChan := make(chan struct{}, 0)
	for i := 0; i < 5; i++ { // 启动5个协程任务
		go func(i int, cancelChan chan struct{}) {
			for { // 每个任务一直在执行
				if isCancelled(cancelChan) { // 每次检查是否任务是否进行停止 进行停止
					break
				}
				time.Sleep(time.Millisecond * 5)
			}
			fmt.Println(i, "Cancelled")
		}(i, cancelChan)
	}
	cancel_2(cancelChan)
	time.Sleep(time.Second * 1)
	/** 运行结果:
	=== RUN   TestCancel
	4 Cancelled
	2 Cancelled
	1 Cancelled
	0 Cancelled
	3 Cancelled
	--- PASS: TestCancel (1.00s)
	*/
}

Context与任务取消

Go并发编程_第5张图片

我们直接取消叶子节点的任务是可以的,但是取消一个父节点,子节点任务不会被取消,当然可以自己去做这种机制。在 Go 的1.9版本之后把 Context 并入到内置包里面了。帮我们做这些事。

Context

  • 根 Context: 通过 context.Background () 创建
  • ⼦ Context: context.WithCancel(parentContext) 创建
    • ctx, cancel := context.WithCancel(context.Background())
  • 当前 Context 被取消时,基于他的⼦子 context 都会被取消
  • 接收取消通知 <-ctx.Done()
func isCancelled(ctx context.Context) bool {
	select {
	case <-ctx.Done():
		return true
	default:
		return false
	}
}

func TestCancel(t *testing.T) {
	ctx, cancel := context.WithCancel(context.Background())
	for i := 0; i < 5; i++ { // 启动5个协程任务
		go func(i int, ctx context.Context) {
			for { // 每个任务一直在执行
				if isCancelled(ctx) {
					break
				}
				time.Sleep(time.Millisecond * 5)
			}
			fmt.Println(i, "Cancelled")
		}(i, ctx)
	}
	cancel()
	time.Sleep(time.Second * 1)
	/** 运行结果:
	=== RUN   TestCancel
	4 Cancelled
	2 Cancelled
	3 Cancelled
	0 Cancelled
	1 Cancelled
	--- PASS: TestCancel (1.00s)
	*/
}

你可能感兴趣的:(Go)