【Go进阶—基础特性】错误

错误处理是任何编程语言都绕不开的话题。一直以来,编程语言的错误处理机制有两大流派:基于异常的结构化 try-catch-finally 处理机制和基于值的处理机制。前者的成员包括 C++、Java、Python、PHP 等主流编程语言,后者的代表则是 C 语言。Go 的设计追求简单,采用的是后一种处理机制:错误就是值,而错误处理就是基于值比较后的决策。

认识 error

在 Go 语言中,错误是值,不过是一个接口值,也即我们平时常用的 error:

// $GOROOT/src/builtin/builtin.go
type interface error {
    Error() string
}                        

error 接口很简单,只声明了一个 Error() 方法。在标准库中提供了构造错误值的两种基本方法:errors.New() 和 fmt.Errorf(),在 Go 1.13 版本之前,这两种方法实际上返回的是一个未导出类型 errors.errorString:

// $GOROOT/src/errors/errors.go
func New(text string) error {
    return &errorString{text}
}

type errorString struct {
    s string
}

func (e *errorString) Error() string {
    return e.s
}

// $GOROOT/src/fmt/errors.go
// 1.13 版本之前
func Errorf(format string, a ...interface{}) error {
    return errors.New(Sprintf(format, a...))
}                       

fmt.Errorf() 适用于需要格式化输出字符串的场景,如果不需要格式化字符串,则建议使用 errors.New()。因为 fmt.Errof() 在生成格式化字符串时需要遍历所有字符,会有一定的性能损失。

错误处理基本策略

了解了错误值后,我们来看一下 Go 语言错误处理的几种惯用策略。

透明策略

透明处理策略是最简单的策略,它完全不关心返回错误值携带的具体上下文信息,只要发生错误就进入唯一的错误处理执行路径。这也是 Go 语言中最常见的错误处理策略,绝大部分的错误处理情形可以归类到这种策略下。

err := doSomething()
if err != nil {
    // 不关心err变量底层错误值所携带的具体上下文信息
    // 执行简单错误处理逻辑并返回
    ...
    return err
}                        

“哨兵”处理策略

“哨兵”策略通过特定值来表示成功和不同的错误,依靠调用方对错误进行检查来处理错误。如果采用这种处理策略,错误值构造方通常会定义一系列导出的“哨兵”错误值,用来辅助错误处理方检视错误值并做出错误处理分支的决策。

// $GOROOT/src/bufio/bufio.go
var (
    ErrInvalidUnreadByte = errors.New("bufio: invalid use of UnreadByte")
    ErrInvalidUnreadRune = errors.New("bufio: invalid use of UnreadRune")
    ErrBufferFull        = errors.New("bufio: buffer full")
    ErrNegativeCount     = errors.New("bufio: negative count")
)

// 错误处理代码
data, err := b.Peek(1)
if err != nil {
    switch err {
    case bufio.ErrNegativeCount:
        // ...
        return
    case bufio.ErrBufferFull:
        // ...
        return
    case bufio.ErrInvalidUnreadByte:
        // ...
        return
    default:
        // ...
        return
    }
}            

与透明错误策略相比,“哨兵”策略让错误处理方可以更灵活地处理错误。不过对于包的开发者而言,暴露“哨兵”错误值意味着这些错误值和包的公共函数一起成为包的一部分,会让错误处理方对其产生依赖。

类型检视策略

类型检视策略又被称为自定义错误策略,顾名思义,这种错误处理方式通过自定义的错误类型来表示特定的错误,同样依赖上层代码对错误值进行检查,不同的是需要使用类型断言机制(type assertion)或类型选择机制(type switch)对错误进行检查。

来看一个标准库的例子:

// $GOROOT/src/encoding/json/decode.go
type UnmarshalTypeError struct {
    Value  string       
    Type   reflect.Type 
    Offset int64        
    Struct string      
    Field  string       
}
            
// $GOROOT/src/encoding/json/decode_test.go
// 通过类型断言机制获取
func TestUnmarshalTypeError(t *testing.T) {
    for _, item := range decodeTypeErrorTests {
        err := Unmarshal([]byte(item.src), item.dest)
        if _, ok := err.(*UnmarshalTypeError); !ok {
            t.Errorf("expected type error for Unmarshal(%q, type %T): got %T",
                    item.src, item.dest, err)
        }
    }
}

// $GOROOT/src/encoding/json/decode.go
// 通过类型选择机制获取
func (d *decodeState) addErrorContext(err error) error {
    if d.errorContext.Struct != nil || len(d.errorContext.FieldStack) > 0 {
        switch err := err.(type) {
        case *UnmarshalTypeError:
            err.Struct = d.errorContext.Struct.Name()
            err.Field = strings.Join(d.errorContext.FieldStack, ".")
            return err
        }
    }
    return err
}                                    

这种错误处理的好处在于可以将错误包装起来,提供更多的上下文信息,但实现方必须向上层公开实现的错误类型,与使用方之间同样需要产生依赖关系。

链式 error

在 1.13 版本之前,使用上述“哨兵”和类型检视策略带来的最大的一个问题是 error 经过函数或方法进行自定义处理后,原始的 error 会被丢弃。

// example 1
func main() {
    err := WriteFile("")
    if err == os.ErrPermission {
        fmt.Println("permission denied")
    }
}

func WriteFile(filename string) error {
    if filename == "" {
        return fmt.Errorf("write file error: %v", os.ErrPermission)
    }
    return nil
}

// example 2
func main() {
    err := WriteFile("")
    if _, ok := err.(*os.PathError); ok {
        fmt.Println("permission denied")
    }
}

func WriteFile(filename string) error {
    if filename == "" {
        return fmt.Errorf("write file error: %v", &os.PathError{})
    }
    return nil
}

通过上面两个示例我们可以看到,原始的 error 经过函数的自定义包装后,它的值或者类型就可能被“淹没”了,使用方不能很容易地获取到它,给错误处理带来了不必要的麻烦。

为了解决这个问题,Go 1.13 版本中引入了一套称为链式 error 的解决方案,error 在函数间传递时信息并不会丢失,而是像链条一样被串连起来。

wrapError

wrapError 是链式 error 的核心数据结构,其他相关优化都是围绕它展开的:

type wrapError struct {
    msg string
    err error
}

func (e *wrapError) Error() string {
    return e.msg
}

func (e *wrapError) Unwrap() error {
    return e.err
}

wrapError 与传统的 errorString 相比,额外实现了 Unwrap 方法,用于返回原始 error。

生成链式 error

在 Go 1.13 版本之后,我们可以使用 fmt.Errorf 函数配合格式动词 %w 来生成链式 error,源码如下:

func Errorf(format string, a ...interface{}) error {
    p := newPrinter()
    p.wrapErrs = true
    // 解析格式,如果发现格式动词 %w 且提供了合法的 error 参数,则把 p.wrappedErr 置为 error 
    p.doPrintf(format, a)
    s := string(p.buf)
    var err error
    if p.wrappedErr == nil {
        // 一般情况下生成 errorString
        err = errors.New(s)
    } else {
        // 存在 %w 动词生成 wrapError
        err = &wrapError{s, p.wrappedErr}
    }
    p.free()
    return err
}

生成 wrapError 有两点需要记住:

  • 每次只能使用一次 %w 动词;
  • %w 动词只能匹配实现 error 接口的参数。

errors.Is

errors 包提供了 Is 方法用于错误处理方对错误值进行比较,Is 支持错误在包装过多层后的等值判断。

func Is(err, target error) bool {
    if target == nil {
        return err == target
    }

    isComparable := reflectlite.TypeOf(target).Comparable()
    for {
        // 如果 target 是可比较的,则直接进行比较
        if isComparable && err == target {
            return true
        }
        // 如果 err 实现了 Is 方法,则调用该方法继续进行判断
        if x, ok := err.(interface{ Is(error) bool }); ok && x.Is(target) {
            return true
        }
        // 否则,对 err 进行 Unwrap(也即返回 wrapError 的 err 字段)
        if err = Unwrap(err); err == nil {
            return false
        }
    }
}

errors.As

As 方法类似于通过类型断言判断一个 error 类型变量是否为特定的自定义错误类型。不同的是,如果 error 类型变量的底层错误值是一个链式 error,那么 As 方法会沿着错误链进行类型比较,直至找到一个匹配的错误类型。

func As(err error, target interface{}) bool {
    if target == nil {
        panic("errors: target cannot be nil")
    }
    // 通过反射获取 target 的值和类型,并进行相关判断
    val := reflectlite.ValueOf(target)
    typ := val.Type()
    if typ.Kind() != reflectlite.Ptr || val.IsNil() {
        panic("errors: target must be a non-nil pointer")
    }
    targetType := typ.Elem()
    if targetType.Kind() != reflectlite.Interface && !targetType.Implements(errorType) {
        panic("errors: *target must be interface or implement error")
    }
    for err != nil {
        // 如果 err 的类型与 target 匹配,直接赋值给 target
        if reflectlite.TypeOf(err).AssignableTo(targetType) {
            val.Elem().Set(reflectlite.ValueOf(err))
            return true
        }
        // 判断 err 是否实现 As 方法,若已实现则调用该方法进一步匹配
        if x, ok := err.(interface{ As(interface{}) bool }); ok && x.As(target) {
            return true
        }
        // 否则,对 err 进行 Unwrap
        err = Unwrap(err)
    }
    return false
}

错误处理建议

关于错误处理的讨论有很多,但没有哪一种错误处理策略适用于所有项目或场合。综合上述的构造错误值方法及错误处理策略,有以下几点建议:

  • 优先使用透明错误处理策略,降低错误处理方与错误值构造方之间的耦合;
  • 其次尽量使用类型检视策略;
  • 在上述两种策略无法实施的情况下,再用“哨兵”策略;
  • 在 Go 1.13 及后续版本中,尽量用 errors.Is 和 errors.As 方法替换原先的错误处理语句。

优化 if err != nil

因为 Go 语言的错误处理机制,会在代码中产生大量的 if err != nil,十分繁琐且不美观,这也是 Go 语言经常被其他主流语言开发者吐槽的地方。那么有什么办法可以优化?

首先能想到的就是视觉上的优化,将多个判断语句放置在一起,但这种方法也只不过是“表面功夫”,而且有很大的局限性。

第二种就是模仿其他语言用 panic 和 recover 来模拟异常捕获来替换错误值判断,不过这是一种反模式,并不推荐使用。首先,错误是正常的编程逻辑,而异常是意料之外的错误,二者不能画等号,而且如果异常没有得到捕获将会导致整个进程退出,个别情况下后果很严重。还有一点,使用异常代替错误机制会大幅影响程序的运行速度。

在这里提供两种优化思路以供参考。

封装多个 error

这个方法就是将多个 if err != nil 语句封装到一个函数或方法中,这样外部调用的时候只需要额外判断一次就可以了。下面看一个例子:

func openBoth(src, dst string) (*os.File, *os.File, error) {
    var r, w *os.File
    var err error
    if r, err = os.Open(src); err != nil {
        return nil, nil, fmt.Errorf("copy %s %s: %v", src, dst, err)
    }
    
    if w, err = os.Create(dst); err != nil {
        r.Close()
        return nil, nil, fmt.Errorf("copy %s %s: %v", src, dst, err)
    }
    return r, w, nil
}

func CopyFile(src, dst string) error {
    var err error
    var r, w *os.File
    if r, w, err = openBoth(src, dst); err != nil {
        return err
    }
    defer func() {
        r.Close()
        w.Close()
        if err != nil {
            os.Remove(dst)
        }
    }()
    
    if _, err = io.Copy(w, r); err != nil {
        return fmt.Errorf("copy %s %s: %v", src, dst, err)
    }
    return nil
}                        

为了减少 CopyFile 函数中 if err != nil 的重复次数,以上代码引入了一个 openBoth 函数,我们将打开源文件、创建目的文件和相关的错误处理工作转移到了 openBoth 函数中。这种方法的优点是比较简单,缺点是效果有时并不显著。

内置 error

我们先粗略看一下 bufio 包的 Writer 实现:

// $GOROOT/src/bufio/bufio.go
type Writer struct {
    err error
    buf []byte
    n   int
    wr  io.Writer
}

func (b *Writer) WriteByte(c byte) error {
    if b.err != nil {
        return b.err
    }
    if b.Available() <= 0 && b.Flush() != nil {
        return b.err
    }
    b.buf[b.n] = c
    b.n++
    return nil
}                       

可以看到,Writer 定义了一个 err 字段作为内部错误状态值,它与 Writer 的实例绑定在了一起,并且在 WriteByte 方法的入口判断是否为 nil。一旦不为 nil,WriteByte 就直接返回内置的 err。我们来使用这种思路来重构一下前面例子中的代码:

type FileCopier struct {
    w   *os.File
    r   *os.File
    err error
}

func (f *FileCopier) open(path string) (*os.File, error) {
    if f.err != nil {
        return nil, f.err
    }
    
    h, err := os.Open(path)
    if err != nil {
        f.err = err
        return nil, err
    }
    return h, nil
}

func (f *FileCopier) openSrc(path string) {
    if f.err != nil {
        return
    }
    
    f.r, f.err = f.open(path)
    return
}

func (f *FileCopier) createDst(path string) {
    if f.err != nil {
        return
    }
    
    f.w, f.err = os.Create(path)
    return
}

func (f *FileCopier) copy() {
    if f.err != nil {
        return
    }
    
    if _, err := io.Copy(f.w, f.r); err != nil {
        f.err = err
    }
}

func (f *FileCopier) CopyFile(src, dst string) error {
    if f.err != nil {
        return f.err
    }
    
    defer func() {
        if f.r != nil {
            f.r.Close()
        }
        if f.w != nil {
            f.w.Close()
        }
        if f.err != nil {
            if f.w != nil {
                os.Remove(dst)
            }
        }
    }()
    
    f.openSrc(src)
    f.createDst(dst)
    f.copy()
    return f.err
}

func main() {
    var fc FileCopier
    err := fc.CopyFile("foo.txt", "bar.txt")
    if err != nil {
        fmt.Println("copy file error:", err)
        return
    }
    fmt.Println("copy file ok")
}                        

我们将原 CopyFile 函数彻底抛弃,将其逻辑封装到 FileCopier 结构的 CopyFile 方法中。FileCopier 结构内置了一个 err 字段用于保存内部的错误状态,这样在 CopyFile 方法中,我们只需按照正常业务逻辑,顺序执行 openSrc、createDst 和 copy 即可,正常业务逻辑的视觉连续性就这样被很好地实现了。

你可能感兴趣的:(golang)