Thead vs. Groutine
Go的GMP调度:
M:系统线程
P:Go实现的协程处理器
G:协程
从图中可看出,Processor 在不同的系统线程中,每个 Processor 都挂着准备运行的协程队列。
Processor 依次运行协程队列中的协程。
这时候问题就来了,假如一个协程运行的时间特别长,把整个 Processor 都占住了,那么在队列中的协程是不是就会被延迟的很久?
在Go启动的时候,会有一个守护线程来去做一个计数,计每个 Processor 运行完成的协程的数量,当一段时间内发现,某个 Processor 完成协程的数量没有发生变化的时候,就会往这个正在运行的协程任务栈插入一个特别的标记,协程在运行的时候遇到非内联函数,就会读到这个标记,就会把自己中断下来,然后插到这个等候协程队列的队尾,切换到别的协程进行运行。
当某一个协程被系统中断了,例如说 io 需要等待的时候,为了提高整体的并发,Processor 会把自己移到另一个可使用的系统线程当中,继续执行它所挂的协程队列,当这个被中断的协程被唤醒完成之后,会把自己加入到其中某个 Processor 的队列里,会加入到全局等待队列中。
当一个协程被中断的时候,它在寄存器里的运行状态也会保存到这个协程对象里,当协程再次获得运行状态的时候,重写写入寄存器,继续运行。
话不多说,直接上代码,如何在代码里启动一个协程:
func TestGroutine(t *testing.T) {
for i := 0; i < 10; i++ {
// int 参数
go func(i int) {
fmt.Println(i)
}(i) // 传入参数
}
// 有可能测试程序结束的非常快 加个等待
time.Sleep(time.Millisecond * 50)
/** 运行结果
=== RUN TestGroutine
1
4
5
2
6
3
0
8
9
7
--- PASS: TestGroutine (0.05s)
*/
}
如果你是 Java 或者 C++ 程序员,那么以下代码非常常见,使用锁来进行并发控制(可惜我是个Phper):
lock lock = ...;
lock.lock();
try{
// process (thread-safe)
}catch(Exception ex){
}finally{
lock.unlock();
}
同样Go也提供了这样的机 package sync:
Mutex 互斥锁
RWLock 读写锁
不使用锁的情况:
func TestCounter(t *testing.T) {
counter := 0
for i := 0; i < 5000; i++ {
go func(i int) {
counter++
}(i)
}
time.Sleep(time.Second * 1)
t.Logf("counter = %d", counter)
/** 运行结果:
=== RUN TestCounter
TestCounter: share_memory_test.go:16: counter = 4627
--- PASS: TestCounter (1.01s)
*/
}
可以发现结果与预期结果不一样,这是因为 conuter
变量在不同的协程里面去做自增,导致了一个并发的竞争条件,传统意义来讲就是一个不是线程安全的程序。要保证线程安全,就要对共享的内存进行锁保护。
func TestCounterThreadSafe(t *testing.T) {
var mut sync.Mutex
counter := 0
for i := 0; i < 5000; i++ {
go func(i int) {
// defer 释放锁
defer func() {
mut.Unlock()
}()
// 加锁
mut.Lock()
counter++
}(i)
}
time.Sleep(time.Second * 1)
t.Logf("counter = %d", counter)
/** 运行结果:
=== RUN TestCounterThreadSafe
TestCounterThreadSafe: share_memory_test.go:40: counter = 5000
--- PASS: TestCounterThreadSafe (1.01s)
*/
}
这次就得到了预期结果。
等待所有协程完成,才能往下执行操作。
上面代码中,怕代码执行太快,所以加了 sleep。
但我们无法控制这个 sleep 需要睡眠时间。
下面来用 WaitGroup
:
func TestCounterWaitGroup(t *testing.T) {
var mut sync.Mutex
var wg sync.WaitGroup
counter := 0
for i := 0; i < 5000; i++ {
wg.Add(1) // 增加一个要等待的协程
go func(i int) {
// defer 释放锁
defer func() {
mut.Unlock()
}()
// 加锁
mut.Lock()
counter++
wg.Done() // 一个协程完成了
}(i)
}
wg.Wait() // 等待所有添加的协程完成 才继续向下运行
t.Logf("counter = %d", counter)
/** 运行结果:
=== RUN TestCounterWaitGroup
TestCounterWaitGroup: share_memory_test.go:66: counter = 5000
--- PASS: TestCounterWaitGroup (0.00s)
*/
}
有人可能会说不就是 Actor Model 嘛
CSP vs. Actor
Channel
Go中Channel的基本机制:
上图左边(非缓冲channel):
通讯的两方必须同时在channel的两边,才能完成这次交互。任何一方不在,另一方就会被阻塞在那里等待,直到等到另一方才能完成这次交互。
上图右边(缓冲channel):
就是对这个channel设置容量,在未满的情况下,放消息的人就能放进去,如果满了,就会发生阻塞等待。
等待拿消息的人去拿,空出来容量。反之,拿消息一样。
func service() string {
time.Sleep(time.Millisecond * 50) // 模拟阻塞
return "Done"
}
func otherTask() {
fmt.Println("working on something else")
time.Sleep(time.Millisecond * 100) // 模拟阻塞
fmt.Println("Task is done.")
}
func TestService(t *testing.T) {
fmt.Println(service())
otherTask()
/** 运行结果:
=== RUN TestService
Done
working on something else
Task is done.
--- PASS: TestService (0.16s)
*/
}
由运行结果可知,完全是串行的,耗时为 0.16s
对 service
进行改造,在调用的时候启动另外一个协程去执行,而不是阻塞当前写的协程。
func service() string {
time.Sleep(time.Millisecond * 50) // 模拟阻塞
return "Done"
}
func otherTask() {
fmt.Println("working on something else")
time.Sleep(time.Millisecond * 100) // 模拟阻塞
fmt.Println("Task is done.")
}
func AsyncService() chan string {
retCh := make(chan string) // 创建一个非缓冲string类型的channel
//retCh := make(chan string, 1) // 创建一个容量为1 string类型的缓冲channel
go func() {
ret := service()
fmt.Println("returned result.")
retCh <- ret // 放入 channel
fmt.Println("service exited.")
}()
return retCh
}
func TestAsyncService(t *testing.T) {
retCh := AsyncService()
otherTask()
fmt.Println(<-retCh) // 从channel拿出
/** 运行结果
=== RUN TestAsyncService
working on something else
returned result.
Task is done.
Done
service exited.
--- PASS: TestAsyncService (0.10s)
*/
}
可以看打印的顺序,实现了一个异步返回结果,耗时 0.1s
select:
多渠道的选择:
select {
case ret := <-retCh:
t.Logf("result %s", ret)
case ret := <-retCh2:
t.Logf("result %s", ret)
default:
t.Error("No one returned")
}
超时控制:
select {
case ret := <-retCh:
t.Logf("result %s", ret)
case <-time.After(time.Second * 1):
t.Error("time out")
}
示例代码:
func service() string {
time.Sleep(time.Millisecond * 500) // 模拟阻塞
return "Done"
}
func AsyncService() chan string {
retCh := make(chan string) // 创建一个非缓冲channel
//retCh := make(chan string, 10) // 创建一个容量为10的缓冲channel
go func() {
ret := service()
fmt.Println("returned result.")
retCh <- ret // 放入 channel
fmt.Println("service exited.")
}()
return retCh
}
func TestSelect(t *testing.T) {
// 上面模拟阻塞 500ms
select {
case ret := <-AsyncService():
t.Log(ret)
case <-time.After(time.Millisecond * 100):
t.Error("time out")
}
/** 运行结果:
=== RUN TestSelect
TestSelect: select_test.go:31: time out
--- FAIL: TestSelect (0.10s)
*/
}
// 生产者
func dataProducer(ch chan int, wg *sync.WaitGroup) {
go func() {
for i := 0; i < 10; i++ {
ch <- i // 放入
}
wg.Done()
}()
}
// 消费者
func dataReceiver(ch chan int, wg *sync.WaitGroup) {
go func() {
for i := 0; i < 10; i++ {
data := <-ch // 取出
fmt.Println(data)
}
wg.Done()
}()
}
func TestCloseChannel(t *testing.T) {
var wg sync.WaitGroup
ch := make(chan int)
wg.Add(1)
dataProducer(ch, &wg)
wg.Add(1)
dataReceiver(ch, &wg)
wg.Wait()
/** 运行结果:
=== RUN TestCloseChannel
0
1
2
3
4
5
6
7
8
9
--- PASS: TestCloseChannel (0.00s)
*/
}
这里可以看到 dataProducer
放数据的时候放了10个,dataReceiver
也是拿了10个。
这是因为我们知道是10,但正常情况 dataReceiver
才能知道 dataProducer
放完了呢。
其一我们可以做个约定,比如 dataProducer
放入个 -1 ,当 dataReceiver
收到 -1 就退出去。
但是又出来一个新问题,如果有多个 dataReceiver
呢,dataProducer
就得知道有多少个 dataReceiver
,来放入多个 -1,问题就是不知道。
channel的关闭:
v, ok <-ch; ok
为 bool 值,true 表示正常接受,false 表示通道关闭改造 dataReceiver
func dataReceiver(ch chan int, wg *sync.WaitGroup) {
go func() {
for {
if data, ok := <-ch; ok { // ok 为 true
fmt.Println(data)
} else { // 结束循环
break
}
}
wg.Done()
}()
}
启动多个 dataReceiver
:
func TestCloseChannel(t *testing.T) {
var wg sync.WaitGroup
ch := make(chan int)
wg.Add(1)
dataProducer(ch, &wg)
wg.Add(1)
dataReceiver(ch, &wg)
wg.Add(1)
dataReceiver(ch, &wg)
wg.Wait()
/** 运行结果:
=== RUN TestCloseChannel
0
1
2
3
5
6
7
8
4
9
--- PASS: TestCloseChannel (0.00s)
*/
}
假如不判断 ok
呢:
func dataReceiver(ch chan int, wg *sync.WaitGroup) {
go func() {
for i := 0; i < 11; i++ { // 上面 dataProducer 放进去了10个
data := <-ch
fmt.Println(data) // 当通道被关闭 会返回一个这个通道定义类型的零值
}
wg.Done()
}()
}
func cancel_1(cancelChan chan struct{}) {
cancelChan <- struct{}{} // 往 channel 中放入消息
}
func cancel_2(cancelChan chan struct{}) {
close(cancelChan)
}
func isCancelled(cancelChan chan struct{}) bool {
select {
case <-cancelChan: // 从 channel 中收到消息 返回true
return true
default:
return false
}
}
func TestCancel(t *testing.T) {
cancelChan := make(chan struct{}, 0)
for i := 0; i < 5; i++ { // 启动5个协程任务
go func(i int, cancelChan chan struct{}) {
for { // 每个任务一直在执行
if isCancelled(cancelChan) { // 每次检查是否任务是否进行停止 进行停止
break
}
time.Sleep(time.Millisecond * 5)
}
fmt.Println(i, "Cancelled")
}(i, cancelChan)
}
cancel_1(cancelChan)
time.Sleep(time.Second * 1)
/** 运行结果:
=== RUN TestCancel
4 Cancelled
--- PASS: TestCancel (1.00s)
*/
}
只有一个 任务被取消掉了,因为 channel 传递过去只有一个信号,而这里有5个协程,其它协程没有被取消。
而我们可以传递5个,将它们全部取消,这样的编程坏处,前面的逻辑和有多少个task进行耦合,必须事先知道有多少个task。
换成第二个取消方法,因为是广播机制,所以所有协程都会收到。
func TestCancel(t *testing.T) {
cancelChan := make(chan struct{}, 0)
for i := 0; i < 5; i++ { // 启动5个协程任务
go func(i int, cancelChan chan struct{}) {
for { // 每个任务一直在执行
if isCancelled(cancelChan) { // 每次检查是否任务是否进行停止 进行停止
break
}
time.Sleep(time.Millisecond * 5)
}
fmt.Println(i, "Cancelled")
}(i, cancelChan)
}
cancel_2(cancelChan)
time.Sleep(time.Second * 1)
/** 运行结果:
=== RUN TestCancel
4 Cancelled
2 Cancelled
1 Cancelled
0 Cancelled
3 Cancelled
--- PASS: TestCancel (1.00s)
*/
}
我们直接取消叶子节点的任务是可以的,但是取消一个父节点,子节点任务不会被取消,当然可以自己去做这种机制。在 Go 的1.9版本之后把 Context
并入到内置包里面了。帮我们做这些事。
Context:
func isCancelled(ctx context.Context) bool {
select {
case <-ctx.Done():
return true
default:
return false
}
}
func TestCancel(t *testing.T) {
ctx, cancel := context.WithCancel(context.Background())
for i := 0; i < 5; i++ { // 启动5个协程任务
go func(i int, ctx context.Context) {
for { // 每个任务一直在执行
if isCancelled(ctx) {
break
}
time.Sleep(time.Millisecond * 5)
}
fmt.Println(i, "Cancelled")
}(i, ctx)
}
cancel()
time.Sleep(time.Second * 1)
/** 运行结果:
=== RUN TestCancel
4 Cancelled
2 Cancelled
3 Cancelled
0 Cancelled
1 Cancelled
--- PASS: TestCancel (1.00s)
*/
}