Uber Go 语言编码规范
Uber 是一家美国硅谷的科技公司,也是 Go 语言的早期 adopter。其开源了很多 golang 项目,诸如被 Gopher 圈熟知的 zap、jaeger 等。2018 年年末 Uber 将内部的 Go 风格规范 开源到 GitHub,经过一年的积累和更新,该规范已经初具规模,并受到广大 Gopher 的关注。本文是该规范的中文版本。本版本会根据原版实时更新。
版本
- 当前更新版本:2019-11-13 版本地址:commit:#71
- 如果您发现任何更新、问题或改进,请随时 fork 和 PR
- Please feel free to fork and PR if you find any updates, issues or improvement.
目录
- 介绍
- 指导原则
- 指向 interface 的指针
- 接收器 (receiver) 与接口
- 零值 Mutex 是有效的
- 在边界处拷贝 Slices 和 Maps
- 使用 defer 释放资源
- Channel 的 size 要么是 1,要么是无缓冲的
- 枚举从 1 开始
- 错误类型
- 错误包装 (Error Wrapping)
- 处理类型断言失败
- 不要 panic
- 使用 go.uber.org/atomic
- 性能
- 优先使用 strconv 而不是 fmt
- 避免字符串到字节的转换
- 尽量初始化时指定 Map 容量
- 规范
- 一致性
- 相似的声明放在一组
- import 分组
- 包名
- 函数名
- 导入别名
- 函数分组与顺序
- 减少嵌套
- 不必要的 else
- 顶层变量声明
- 对于未导出的顶层常量和变量,使用_作为前缀
- 结构体中的嵌入
- 使用字段名初始化结构体
- 本地变量声明
- nil 是一个有效的 slice
- 小变量作用域
- 避免参数语义不明确(Avoid Naked Parameters)
- 使用原始字符串字面值,避免转义
- 初始化 Struct 引用
- 初始化 Maps
- 字符串 string format
- 命名 Printf 样式的函数
- 编程模式
- 表驱动测试
- 功能选项
介绍
样式 (style) 是支配我们代码的惯例。术语样式
有点用词不当,因为这些约定涵盖的范围不限于由 gofmt 替我们处理的源文件格式。
本指南的目的是通过详细描述在 Uber 编写 Go 代码的注意事项来管理这种复杂性。这些规则的存在是为了使代码库易于管理,同时仍然允许工程师更有效地使用 Go 语言功能。
该指南最初由 Prashant Varanasi 和 Simon Newton 编写,目的是使一些同事能快速使用 Go。多年来,该指南已根据其他人的反馈进行了修改。
本文档记录了我们在 Uber 遵循的 Go 代码中的惯用约定。其中许多是 Go 的通用准则,而其他扩展准则依赖于下面外部的指南:
- Effective Go
- The Go common mistakes guide
所有代码都应该通过golint
和go vet
的检查并无错误。我们建议您将编辑器设置为:
- 保存时运行
goimports
- 运行
golint
和go vet
检查错误
您可以在以下 Go 编辑器工具支持页面中找到更为详细的信息:
https://github.com/golang/go/wiki/IDEsAndTextEditorPlugins
指导原则
指向 interface 的指针
您几乎不需要指向接口类型的指针。您应该将接口作为值进行传递,在这样的传递过程中,实质上传递的底层数据仍然可以是指针。
接口实质上在底层用两个字段表示:
- 一个指向某些特定类型信息的指针。您可以将其视为"type"。
- 数据指针。如果存储的数据是指针,则直接存储。如果存储的数据是一个值,则存储指向该值的指针。
如果希望接口方法修改基础数据,则必须使用指针传递。
接收器 (receiver) 与接口
使用值接收器的方法既可以通过值调用,也可以通过指针调用。
例如,
type S struct {
data string
}
func (s S) Read() string {
return s.data
}
func (s *S) Write(str string) {
s.data = str
}
sVals := map[int]S{1: {"A"}}
// 你只能通过值调用 Read
sVals[1].Read()
// 这不能编译通过:
// sVals[1].Write("test")
sPtrs := map[int]*S{1: {"A"}}
// 通过指针既可以调用 Read,也可以调用 Write 方法
sPtrs[1].Read()
sPtrs[1].Write("test")
同样,即使该方法具有值接收器,也可以通过指针来满足接口。
type F interface {
f()
}
type S1 struct{}
func (s S1) f() {}
type S2 struct{}
func (s *S2) f() {}
s1Val := S1{}
s1Ptr := &S1{}
s2Val := S2{}
s2Ptr := &S2{}
var i F
i = s1Val
i = s1Ptr
i = s2Ptr
// 下面代码无法通过编译。因为 s2Val 是一个值,而 S2 的 f 方法中没有使用值接收器
// i = s2Val
Effective Go 中有一段关于 pointers vs. values 的精彩讲解。
零值 Mutex 是有效的
零值 sync.Mutex
和 sync.RWMutex
是有效的。所以指向 mutex 的指针基本是不必要的。
Bad | Good |
---|---|
|
|
如果你使用结构体指针,mutex 可以非指针形式作为结构体的组成字段,或者更好的方式是直接嵌入到结构体中。
如果是私有结构体类型或是要实现 Mutex 接口的类型,我们可以使用嵌入 mutex 的方法:
|
|
为私有类型或需要实现互斥接口的类型嵌入。 | 对于导出的类型,请使用专用字段。 |
在边界处拷贝 Slices 和 Maps
slices 和 maps 包含了指向底层数据的指针,因此在需要复制它们时要特别注意。
接收 Slices 和 Maps
请记住,当 map 或 slice 作为函数参数传入时,如果您存储了对它们的引用,则用户可以对其进行修改。
Bad | Good |
---|---|
|
|
返回 slices 或 maps
同样,请注意用户对暴露内部状态的 map 或 slice 的修改。
Bad | Good |
---|---|
|
|
使用 defer 释放资源
使用 defer 释放资源,诸如文件和锁。
Bad | Good |
---|---|
|
|
Defer 的开销非常小,只有在您可以证明函数执行时间处于纳秒级的程度时,才应避免这样做。使用 defer 提升可读性是值得的,因为使用它们的成本微不足道。尤其适用于那些不仅仅是简单内存访问的较大的方法,在这些方法中其他计算的资源消耗远超过 defer
。
Channel 的 size 要么是 1,要么是无缓冲的
channel 通常 size 应为 1 或是无缓冲的。默认情况下,channel 是无缓冲的,其 size 为零。任何其他尺寸都必须经过严格的审查。考虑如何确定大小,是什么阻止了 channel 在负载下被填满并阻止写入,以及发生这种情况时发生了什么。
Bad | Good |
---|---|
|
|
枚举从 1 开始
在 Go 中引入枚举的标准方法是声明一个自定义类型和一个使用了 iota 的 const 组。由于变量的默认值为 0,因此通常应以非零值开头枚举。
Bad | Good |
---|---|
|
|
在某些情况下,使用零值是有意义的(枚举从零开始),例如,当零值是理想的默认行为时。
type LogOutput int
const (
LogToStdout LogOutput = iota
LogToFile
LogToRemote
)
// LogToStdout=0, LogToFile=1, LogToRemote=2
错误类型
Go 中有多种声明错误(Error) 的选项:
-
errors.New
对于简单静态字符串的错误 -
fmt.Errorf
用于格式化的错误字符串 - 实现
Error()
方法的自定义类型 - 用
"pkg/errors".Wrap
的 Wrapped errors
返回错误时,请考虑以下因素以确定最佳选择:
这是一个不需要额外信息的简单错误吗?如果是这样,
errors.New
足够了。客户需要检测并处理此错误吗?如果是这样,则应使用自定义类型并实现该
Error()
方法。您是否正在传播下游函数返回的错误?如果是这样,请查看本文后面有关错误包装 section on error wrapping 部分的内容。
否则
fmt.Errorf
就可以了。
如果客户端需要检测错误,并且您已使用创建了一个简单的错误 errors.New
,请使用一个错误变量。
Bad | Good |
---|---|
|
|
如果您有可能需要客户端检测的错误,并且想向其中添加更多信息(例如,它不是静态字符串),则应使用自定义类型。
Bad | Good |
---|---|
|
|
直接导出自定义错误类型时要小心,因为它们已成为程序包公共 API 的一部分。最好公开匹配器功能以检查错误。
// package foo
type errNotFound struct {
file string
}
func (e errNotFound) Error() string {
return fmt.Sprintf("file %q not found", e.file)
}
func IsNotFoundError(err error) bool {
_, ok := err.(errNotFound)
return ok
}
func Open(file string) error {
return errNotFound{file: file}
}
// package bar
if err := foo.Open("foo"); err != nil {
if foo.IsNotFoundError(err) {
// handle
} else {
panic("unknown error")
}
}
错误包装 (Error Wrapping)
一个(函数/方法)调用失败时,有三种主要的错误传播方式:
如果没有要添加的其他上下文,并且您想要维护原始错误类型,则返回原始错误。
添加上下文,使用
"pkg/errors".Wrap
以便错误消息提供更多上下文 ,"pkg/errors".Cause
可用于提取原始错误。
Use fmt.Errorf if the callers do not need to detect or handle that specific error case.如果调用者不需要检测或处理的特定错误情况,使用
fmt.Errorf
。
建议在可能的地方添加上下文,以使您获得诸如“调用服务 foo:连接被拒绝”之类的更有用的错误,而不是诸如“连接被拒绝”之类的模糊错误。
在将上下文添加到返回的错误时,请避免使用“failed to”之类的短语来保持上下文简洁,这些短语会陈述明显的内容,并随着错误在堆栈中的渗透而逐渐堆积:
Bad | Good |
---|---|
|
|
|
|
但是,一旦将错误发送到另一个系统,就应该明确消息是错误消息(例如使用err
标记,或在日志中以”Failed”为前缀)。
另请参见 Don't just check errors, handle them gracefully. 不要只是检查错误,要优雅地处理错误
处理类型断言失败
type assertion 的单个返回值形式针对不正确的类型将产生 panic。因此,请始终使用“comma ok”的惯用法。
Bad | Good |
---|---|
|
|
不要 panic
在生产环境中运行的代码必须避免出现 panic。panic 是 cascading failures 级联失败的主要根源 。如果发生错误,该函数必须返回错误,并允许调用方决定如何处理它。
Bad | Good |
---|---|
|
|
panic/recover 不是错误处理策略。仅当发生不可恢复的事情(例如:nil 引用)时,程序才必须 panic。程序初始化是一个例外:程序启动时应使程序中止的不良情况可能会引起 panic。
var _statusTemplate = template.Must(template.New("name").Parse("_statusHTML"))
即使在测试代码中,也优先使用t.Fatal
或者t.FailNow
而不是 panic 来确保失败被标记。
Bad | Good |
---|---|
|
|
使用 go.uber.org/atomic
使用 sync/atomic 包的原子操作对原始类型 (int32
, int64
等)进行操作,因为很容易忘记使用原子操作来读取或修改变量。
go.uber.org/atomic 通过隐藏基础类型为这些操作增加了类型安全性。此外,它包括一个方便的atomic.Bool
类型。
Bad | Good |
---|---|
|
|
性能
性能方面的特定准则只适用于高频场景。
优先使用 strconv 而不是 fmt
将原语转换为字符串或从字符串转换时,strconv
速度比fmt
快。
Bad | Good |
---|---|
|
|
|
|
避免字符串到字节的转换
不要反复从固定字符串创建字节 slice。相反,请执行一次转换并捕获结果。
Bad | Good |
---|---|
|
|
|
|
尽量初始化时指定 Map 容量
在尽可能的情况下,在使用 make()
初始化的时候提供容量信息
make(map[T1]T2, hint)
为 make()
提供容量信息(hint)尝试在初始化时调整 map 大小,
这减少了在将元素添加到 map 时增长和分配的开销。
注意,map 不能保证分配 hint 个容量。因此,即使提供了容量,添加元素仍然可以进行分配。
Bad | Good |
---|---|
|
|
|
|
规范
一致性
本文中概述的一些标准都是客观性的评估,是根据场景、上下文、或者主观性的判断;
但是最重要的是,保持一致.
一致性的代码更容易维护、是更合理的、需要更少的学习成本、并且随着新的约定出现或者出现错误后更容易迁移、更新、修复 bug
相反,一个单一的代码库会导致维护成本开销、不确定性和认知偏差。所有这些都会直接导致速度降低、
代码审查痛苦、而且增加 bug 数量
将这些标准应用于代码库时,建议在 package(或更大)级别进行更改,子包级别的应用程序通过将多个样式引入到同一代码中,违反了上述关注点。
相似的声明放在一组
Go 语言支持将相似的声明放在一个组内。
Bad | Good |
---|---|
|
|
这同样适用于常量、变量和类型声明:
Bad | Good |
---|---|
|
|
仅将相关的声明放在一组。不要将不相关的声明放在一组。
Bad | Good |
---|---|
|
|
分组使用的位置没有限制,例如:你可以在函数内部使用它们:
Bad | Good |
---|---|
|
|
import 分组
导入应该分为两组:
- 标准库
- 其他库
默认情况下,这是 goimports 应用的分组。
Bad | Good |
---|---|
|
|
包名
当命名包时,请按下面规则选择一个名称:
- 全部小写。没有大写或下划线。
- 大多数使用命名导入的情况下,不需要重命名。
- 简短而简洁。请记住,在每个使用的地方都完整标识了该名称。
- 不用复数。例如
net/url
,而不是net/urls
。 - 不要用“common”,“util”,“shared”或“lib”。这些是不好的,信息量不足的名称。
另请参阅 Package Names 和 Go 包样式指南.
函数名
我们遵循 Go 社区关于使用 MixedCaps 作为函数名 的约定。有一个例外,为了对相关的测试用例进行分组,函数名可能包含下划线,如:TestMyFunction_WhatIsBeingTested
.
导入别名
如果程序包名称与导入路径的最后一个元素不匹配,则必须使用导入别名。
import (
"net/http"
client "example.com/client-go"
trace "example.com/trace/v2"
)
在所有其他情况下,除非导入之间有直接冲突,否则应避免导入别名。
Bad | Good |
---|---|
|
|
函数分组与顺序
- 函数应按粗略的调用顺序排序。
- 同一文件中的函数应按接收者分组。
因此,导出的函数应先出现在文件中,放在struct
, const
, var
定义的后面。
在定义类型之后,但在接收者的其余方法之前,可能会出现一个 newXYZ()
/NewXYZ()
由于函数是按接收者分组的,因此普通工具函数应在文件末尾出现。
Bad | Good |
---|---|
|
|
减少嵌套
代码应通过尽可能先处理错误情况/特殊情况并尽早返回或继续循环来减少嵌套。减少嵌套多个级别的代码的代码量。
Bad | Good |
---|---|
|
|
不必要的 else
如果在 if 的两个分支中都设置了变量,则可以将其替换为单个 if。
Bad | Good |
---|---|
|
|
顶层变量声明
在顶层,使用标准var
关键字。请勿指定类型,除非它与表达式的类型不同。
Bad | Good |
---|---|
|
|
如果表达式的类型与所需的类型不完全匹配,请指定类型。
type myError struct{}
func (myError) Error() string { return "error" }
func F() myError { return myError{} }
var _e error = F()
// F 返回一个 myError 类型的实例,但是我们要 error 类型
对于未导出的顶层常量和变量,使用_作为前缀
在未导出的顶级vars
和consts
, 前面加上前缀_,以使它们在使用时明确表示它们是全局符号。
例外:未导出的错误值,应以err
开头。
基本依据:顶级变量和常量具有包范围作用域。使用通用名称可能很容易在其他文件中意外使用错误的值。
Bad | Good |
---|---|
|
|
结构体中的嵌入
嵌入式类型(例如 mutex)应位于结构体内的字段列表的顶部,并且必须有一个空行将嵌入式字段与常规字段分隔开。
Bad | Good |
---|---|
|
|
使用字段名初始化结构体
初始化结构体时,几乎始终应该指定字段名称。现在由 go vet
强制执行。
Bad | Good |
---|---|
|
|
例外:如果有 3 个或更少的字段,则可以在测试表中省略字段名称。
tests := []struct{
op Operation
want string
}{
{Add, "add"},
{Subtract, "subtract"},
}
本地变量声明
如果将变量明确设置为某个值,则应使用短变量声明形式 (:=
)。
Bad | Good |
---|---|
|
|
但是,在某些情况下,var
使用关键字时默认值会更清晰。例如,声明空切片。
Bad | Good |
---|---|
|
|
nil 是一个有效的 slice
nil
是一个有效的长度为 0 的 slice,这意味着,
-
您不应明确返回长度为零的切片。应该返回
nil
来代替。
Bad Good
if x == "" { return []int{} }
if x == "" { return nil }
-
要检查切片是否为空,请始终使用
len(s) == 0
。而非nil
。
Bad Good
func isEmpty(s []string) bool { return s == nil }
func isEmpty(s []string) bool { return len(s) == 0 }
-
零值切片(用
var
声明的切片)可立即使用,无需调用make()
创建。
Bad Good
nums := []int{} // or, nums := make([]int) if add1 { nums = append(nums, 1) } if add2 { nums = append(nums, 2) }
var nums []int if add1 { nums = append(nums, 1) } if add2 { nums = append(nums, 2) }
小变量作用域
如果有可能,尽量缩小变量作用范围。除非它与 减少嵌套的规则冲突。
Bad | Good |
---|---|
|
|
如果需要在 if 之外使用函数调用的结果,则不应尝试缩小范围。
Bad | Good |
---|---|
|
|
避免参数语义不明确(Avoid Naked Parameters)
函数调用中的意义不明确的参数
可能会损害可读性。当参数名称的含义不明显时,请为参数添加 C 样式注释 (/* ... */
)
Bad | Good |
---|---|
|
|
对于上面的示例代码,还有一种更好的处理方式是将上面的 bool
类型换成自定义类型。将来,该参数可以支持不仅仅局限于两个状态(true/false)。
type Region int
const (
UnknownRegion Region = iota
Local
)
type Status int
const (
StatusReady = iota + 1
StatusDone
// Maybe we will have a StatusInProgress in the future.
)
func printInfo(name string, region Region, status Status)
使用原始字符串字面值,避免转义
Go 支持使用 原始字符串字面值,也就是 " ` " 来表示原生字符串,在需要转义的场景下,我们应该尽量使用这种方案来替换。
可以跨越多行并包含引号。使用这些字符串可以避免更难阅读的手工转义的字符串。
Bad | Good |
---|---|
|
|
初始化 Struct 引用
在初始化结构引用时,请使用&T{}
代替new(T)
,以使其与结构体初始化一致。
Bad | Good |
---|---|
|
|
初始化 Maps
对于空 map 请使用 make(..)
初始化, 并且 map 是通过编程方式填充的。
这使得 map 初始化在表现上不同于声明,并且它还可以方便地在 make 后添加大小提示。
Bad | Good |
---|---|
|
|
声明和初始化看起来非常相似的。 |
声明和初始化看起来差别非常大。 |
在尽可能的情况下,请在初始化时提供 map 容量大小,详细请看 尽量初始化时指定 Map 容量。
另外,如果 map 包含固定的元素列表,则使用 map literals(map 初始化列表) 初始化映射。
Bad | Good |
---|---|
|
|
基本准则是:在初始化时使用 map 初始化列表 来添加一组固定的元素。否则使用 make
(如果可以,请尽量指定 map 容量)。
字符串 string format
如果你为Printf
-style 函数声明格式字符串,请将格式化字符串放在外面,并将其设置为const
常量。
这有助于go vet
对格式字符串执行静态分析。
Bad | Good |
---|---|
|
|
命名 Printf 样式的函数
声明Printf
-style 函数时,请确保go vet
可以检测到它并检查格式字符串。
这意味着您应尽可能使用预定义的Printf
-style 函数名称。go vet
将默认检查这些。有关更多信息,请参见 Printf 系列。
如果不能使用预定义的名称,请以 f 结束选择的名称:Wrapf
,而不是Wrap
。go vet
可以要求检查特定的 Printf 样式名称,但名称必须以f
结尾。
$ go vet -printfuncs=wrapf,statusf
另请参阅 go vet: Printf family check.
编程模式
表驱动测试
当测试逻辑是重复的时候,通过 subtests 使用 table 驱动的方式编写 case 代码看上去会更简洁。
Bad | Good |
---|---|
|
|
很明显,使用 test table 的方式在代码逻辑扩展的时候,比如新增 test case,都会显得更加的清晰。
我们遵循这样的约定:将结构体切片称为tests
。 每个测试用例称为tt
。此外,我们鼓励使用give
和want
前缀说明每个测试用例的输入和输出值。
tests := []struct{
give string
wantHost string
wantPort string
}{
// ...
}
for _, tt := range tests {
// ...
}
功能选项
功能选项是一种模式,您可以在其中声明一个不透明 Option 类型,该类型在某些内部结构中记录信息。您接受这些选项的可变编号,并根据内部结构上的选项记录的全部信息采取行动。
将此模式用于您需要扩展的构造函数和其他公共 API 中的可选参数,尤其是在这些功能上已经具有三个或更多参数的情况下。
Bad | Good |
---|---|
|
|
还可以参考下面资料:
Self-referential functions and the design of options
Functional options for friendly APIs
本文由zshipu.com学习笔记或整理或转载,如有侵权请联系,必改之。