golang 详解协程——errgroup

为什么要有sync.errgroup
go支持并发,一般采用的是 channel 、 sync.WaitGroup 、context,来实现各个协程之间的流程控制和消息传递。
但是对于开启的成千上万的协程,如果在每个协程内都自行去打印 错误日志的话,会造成日志分散,不好分析。
所以我们要实现一种能统一处理各个协程错误的工具

什么是 sync.errgroup
Go团队在实验仓库中添加了一个名为sync.errgroup的新软件包。 sync.ErrGroup再sync.WaitGroup功能的基础上,增加了错误传递,以及在发生不可恢复的错误时取消整个goroutine集合,或者等待超时

主要是利用了 waitgroup,context以及sync.Once,对这三个不熟悉的应先去看下相应的知识点获取方法
go get golang.org/x/sync
1
errgroup 的功能
1、处理子协程 error

func main() {
	var g errgroup.Group  // 声明一个group实例
	var urls = []string{
		"http://www.golang.org/",
		"http://www.google.com/",
		"http://www.somestupidname.com/",
	}
	for _, url := range urls {  // 分别获取网站内容
		url := url // url是局部变量,for循环中对多个协程传递值时,需要重新进行赋值
		g.Go(func() error {  // group 的go方法,启一个协程去执行代码
			// Fetch the URL.
			resp, err := http.Get(url)
			if err == nil {
				resp.Body.Close()
			}
			return err
		})
	}
	if err := g.Wait(); err == nil {  // group 的wait方法,等待上面的 g.go的协程执行完成,并且可以接受错误
		fmt.Println("Successfully fetched all URLs.")
	}
}

上面这个例子是简单的利用 errgroup 进行的 waitGroup和error的处理,下面我们对关键的代码做一个分析,并结合源码来看

var g errgroup.Group
声明一个 group的实例,我们看下 group 包含哪些东西

type Group struct {
	cancel func()

	wg sync.WaitGroup

	errOnce sync.Once
	err     error
}

group是一个结构体,包含四个部分

cancel 一个取消的函数,主要来包装context.WithCancel的CancelFunc
wg 借助于WaitGroup实现的
errOnce 使用sync.Once实现只输出第一个err
err 记录下错误的信息
g.Go(func() error {}
启动goroutine 执行代码
记录第一个出错的goroutine的err信息。我们看下源码

func (g *Group) Go(f func() error) {
	g.wg.Add(1)  // 和WaitGroup 一样,每执行一个新的g,通过add方法 加1

	go func() {
		defer g.wg.Done() // 执行结束后 调用 Done方法,减1

		if err := f(); err != nil {  // 执行传入的匿名函数
			g.errOnce.Do(func() {   // 如果匿名函数返回错误,会记录错误信息。注意这里用的 once.Do,只执行一次,仅会记录第一个出现的err
				g.err = err
				if g.cancel != nil {  // 如果初始化的有 cancel 函数,会调用 cancel退出
					g.cancel()
				}
			})
		}
	}()
}

再来看下 g.Wait()func (g *Group) Wait() error {

func (g *Group) Wait() error {
	g.wg.Wait()  // 和 WaitGroup 一样,在主线程调用 wait 方法,阻塞等待所有g执行完成
	if g.cancel != nil {  // 如果初始化了 cancel 函数,就执行
		g.cancel()
	}
	return g.err  // 返回第一个出现的err信息
}

2、结合 context 来使用

package main

import (
	"context"
	"fmt"
	"golang.org/x/sync/errgroup"
	"time"
)

func main() {
	ctx, cancel := context.WithCancel(context.Background())
	group, errCtx := errgroup.WithContext(ctx)

	for index := 0; index < 3; index++ {
		indexTemp := index

		// 新建子协程
		group.Go(func() error {
			fmt.Printf("indexTemp=%d \n", indexTemp)
			if indexTemp == 0 { // 第一个协程
				fmt.Println("indexTemp == 0 start ")
				fmt.Println("indexTemp == 0 end")
			} else if indexTemp == 1 { // 第二个协程
				fmt.Println("indexTemp == 1 start")
				//这里一般都是某个协程发生异常之后,调用cancel()
				//这样别的协程就可以通过errCtx获取到err信息,以便决定是否需要取消后续操作
				cancel() // 第二个协程异常退出
				fmt.Println("indexTemp == 1 err ")
			} else if indexTemp == 2 {
				fmt.Println("indexTemp == 2 begin")

				// 休眠1秒,用于捕获子协程2的出错
				time.Sleep(1 * time.Second)

				//检查 其他协程已经发生错误,如果已经发生异常,则不再执行下面的代码
				err := CheckGoroutineErr(errCtx) // 第三个协程感知第二个协程是否正常
				if err != nil {
					return err
				}
				fmt.Println("indexTemp == 2 end ")
			}
			return nil
		})
	}

	// 捕获err
	err := group.Wait()
	if err == nil {
		fmt.Println("都完成了")
	} else {
		fmt.Printf("get error:%v", err)
	}
}

//校验是否有协程已发生错误
func CheckGoroutineErr(errContext context.Context) error {
	select {
	case <-errContext.Done():
		return errContext.Err()
	default:
		return nil
	}
}


可以结合contex 来实现主动退出及超时控制
————————————————
版权声明:本文为CSDN博主「老赵骑摩托」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_43753680/article/details/118514525

你可能感兴趣的:(golang,iphone,爬虫)