Golang 使用以下类型:
包 (pkg) 是 Go 工作区中包含 Go 源文件或其他包的目录。源文件中的每个函数、变量和类型都存储在链接包中。每个 Go 源文件都属于一个包,该包在文件顶部使用以下命令声明:
package <packagename>
您可以使用以下方法导入和导出包以重用导出的函数或类型:
import <packagename>
Golang 的标准包是fmt
,其中包含格式化和打印功能,如Println()
.
Go支持显式类型转换以满足其严格的类型要求。
i := 55 //int
j := 67.8 //float64
sum := i + int(j) //j is converted to int
一个 Goroutine 是一个函数或方法执行同时旁边其他任何够程采用了特殊的Goroutine 线程。 Goroutine 线程比标准线程更轻量级,大多数 Golang 程序同时使用数千个 Goroutine。
要创建 Goroutine,请 go 在函数声明之前添加关键字。
go f(x, y, z)
您可以通过向 Goroutine 发送一个信号通道来停止它。 Goroutines 只能在被告知检查时响应信号,因此您需要在逻辑位置(例如 for 循环顶部)包含检查。
package main
func main() {
quit := make(chan bool)
go func() {
for {
select {
case <-quit:
return
default:
// …
}
}
}()
// …
quit <- true
}
类型开关(Type Switch)是在运行时检查变量类型的最佳方式。类型开关按类型而不是值来评估变量。每个 Switch 至少包含一个 case 用作条件语句,如果没有一个 case 为真,则执行 default。
如果两个接口有相同的方法列表,那么他们就是等价的,可以相互赋值。如果接口 A 的方法列表是接口 B 的方法列表的自己,那么接口 B 可以赋值给接口A。接口查询是否成功,要在运行期才能够确定。
当一个 Goroutine(协程)
获得了Mutex
后,其他Goroutine(协程)
就只能乖乖的等待,除非该Goroutine
释放了该Mutex
。RWMutex
在读锁占用的情况下,会阻止写,但不阻止读RWMutex
。在写锁占用情况下,会阻止任何其他Goroutine(无论读和写)进来,整个锁相当于由该Goroutine
独占同步锁的作用是保证资源在使用时的独有性,不会因为并发而导致数据错乱,保证系统的稳定性。
无缓冲的 channel 是同步的,而有缓冲的 channel 是非同步的。
可以作用于的类型有:
new 创建一个该类型的实例,并且返回指向该实例的指针。 new 函数是内建函数,函数定义:
func new(Type) *Type
make
的作用是为slice
, map
or chan
的初始化 然后返回引用make
函数是内建函数,函数定义:
func make(Type, size IntegerType) Type
make(T, args)
函数的目的和new(T)
不同,仅仅用于创建slice
,map
,channel
,而且返回类型是实例
虽然这三个函数,都是格式化输出,但是输出的目标不一样
数组:
数组固定长度。 数组长度是数组类型的一部分,所以[3]int 和[4]int 是两种不同的数组类型数组需要指定大小,不指定也会根据初始化, 自动推算出大小,大小不可改变。 数组是通过值传递的
切片:
切片可以改变长度。 切片是轻量级的数据结构,三个属性,指针,长度,容量不需要指定大小切片是地址传递(引用传递)可以通过数组来初始化,也可以通过内置函数 make()来初始化,初始化的时候 len=cap,然后进行扩容。
func main() {
arr := make([]int, 0)
for i := 0; i < 2000; i++ {
fmt.Println("len 为", len(arr), "cap 为", cap(arr))
arr = append(arr, i)
}
}
我们可以看下结果,依次是:
0, 1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024
但到了1024
之后,就变成了:
1024, 1280, 1696, 2304
每次都是扩容了四分之一左右。
defer 的作用是:
你只需要在调用普通函数或方法前加上关键字 defer,就完成了 defer 所需要的语法。当 defer 语句被执行时,跟在 defer 后面的函数会被延迟执行。直到包含该 defer 语句的函数执行完毕时, defer 后的函数才会被执行,不论包含defer 语句的函数是通过 return 正常结束,还是由于 panic 导致的异常结束。你可以在一个函数中执行多条 defer 语句,它们的执行顺序与声明顺序相反。
defer 的常用场景:
切片是基于数组实现的,它的底层是数组,它自己本身非常小,可以理解为对底层数组的抽象。因为基于数组实现,所以它的底层的内存是连续分配的,效率非常高,还可以通过索引获得数据。
切片本身并不是动态数组或者数组指针。它内部实现的数据结构通过指针引用底层数组,设定相关属性将数据读写操作限定在指定的区域内。切片本身是一个只读对象,其工作机制类似数组指针的一种封装。
切片对象非常小,是因为它是只有 3 个字段的数据结构:
Go 中切片扩容的策略是这样的:
情况一:
原数组还有容量可以扩容(实际容量没有填充完),这种情况下,扩容以后的数组还是指向原来的数组,对一个切片的操作可能影响多个指针指向相同地址的 Slice。
情况二:
原来数组的容量已经达到了最大值,再想扩容, Go 默认会先开一片内存区域,把原来的值拷贝过来,然后再执行 append() 操作。这种情况丝毫不影响原数组。
要复制一个 Slice,最好使用 Copy 函数。
Go 语言中所有的传参都是值传递(传值),都是一个副本,一个拷贝。
因为拷贝的内容有时候是非引用类型( int、 string、 struct 等这些),这样就在函数中就无法修改原内容数据;有的是引用类型( 指针、 map、 slice、 chan 等这些),这样就可以修改原内容数据。
Golang 的引用类型包括 slice、 map 和 channel。它们有复杂的内部结构,除了申请内存外,还需要初始化相关属性。
内置函数 new 计算类型大小,为其分配零值内存,返回指针。而 make 会被编译器翻译成具体的创建函数,由其分配内存和初始化成员结构,返回对象而非指针。
Golang中map
的底层实现是一个散列表,因此实现map
的过程实际上就是实现散表的过程。在这个散列表中,主要出现的结构体有两个,一个叫 hmap(aheader for a go map),一个叫 bmap(a bucket for a Go map,通常叫其bucket)。
Go 语言中map
采用的是哈希查找表,由一个key
通过哈希函数得到哈希值, 64位系统中就生成一个64bit
的哈希值,由这个哈希值将 key 对应存到不同的桶(bucket)中,当有多个哈希映射到相同的的桶中时,使用链表解决哈希冲突。
细节: key
经过hash
后共 64 位,根据hmap
中B
的值,计算它到底要落在哪个桶时,桶的数量为2^B
,如B=5
,那么用 64 位最后 5 位表示第几号桶,在用hash
值的高 8 位确定在 bucket 中的存储位置,当前bmap
中的bucket
未找到,则查询对应的overflow bucket
,对应位置有数据则对比完整的哈希值,确定是否是要查找的数据。如果当前map
处于数据搬移状态,则优先从oldbuckets
查找。
Go 语言中,不要通过共享内存来通信,而要通过通信来实现内存共享。 Go 的CSP(Communicating Sequential Process)
并发模型,中文可以叫做通信顺序进程,是通过goroutine
和channel
来实现的。
channel
收发遵循先进先出FIFO
的原则。分为有缓冲区和无缓冲区,channel
中包括buffer
、sendx
和recvx
收发的位置(ring buffer
记录实现)、sendq
、recv
。当channel
因为缓冲区不足而阻塞了队列,则使用双向链表存储。
channel
中使用了ring buffer
( 环形缓冲区) 来缓存写入的数据。ringbuffer
有很多好处,而且非常适合用来实现 FIFO 式的固定长度队列。
在channel
中,ring buffer
的实现如下:
上图展示的是一个缓冲区为 8 的 channel buffer, recvx 指向最早被读取的数
据, sendx 指向再次写入时插入的位置。
mutexLocked
: 表示互斥锁的锁定状态;mutexWoken
: 表示从正常模式被从唤醒;mutexStarving
: 当前的互斥锁进入饥饿状态;waitersCount
: 当前互斥锁上等待的 Goroutine 个数;正常模式(非公平锁)
正常模式下,所有等待锁的goroutine
按照FIFO( 先进先出)
顺序等待。唤醒的goroutine
不会直接拥有锁,而是会和新请求goroutine
竞争锁。新请求的goroutine
更容易抢占:因为它正在CPU
上执行,所以刚刚唤醒的goroutine
有很大可能在锁竞争中失败。在这种情况下,这个被唤醒的goroutine
会加入到等待队列的前面。
饥饿模式(公平锁)
为了解决了等待goroutine
队列的长尾问题饥饿模式下,直接由unlock
把锁交给等待队列中排在第一位的goroutine
(队头),同时,饥饿模式下,新进来的goroutine
不会参与抢锁也不会进入自旋状态,会直接进入等待队列的尾部。 这样很好的解决了老的goroutine
一直抢不到锁的场景。
饥饿模式的触发条件: 当一个goroutine
等待锁时间超过 1 毫秒时,或者当前队列只剩下一个 goroutine
的时候,Mutex
切换到饥饿模式。
总结
对于两种模式,正常模式下的性能是最好的,goroutine
可以连续多次获取锁,饥饿模式解决了取锁公平的问题,但是性能会下降, 这其实是性能和公平的一个平衡模式。
通过记录readerCount
读锁的数量来进行控制,当有一个写锁的时候,会将读锁数量设置为负数 1<<30。目的是让新进入的读锁等待之前的写锁释放通知读锁。同样的当有写锁进行抢占时, 也会等待之前的读锁都释放完毕,才会开始进行后续的操作。 而等写锁释放完之后,会将值重新加上 1<<30, 并通知刚才新进入的读锁( rw.readerSem) ,两者互相限制。
Cond 实现了一种条件变量,可以使用在多个Reader
等待共享资源ready
的场景(如果只有一读一写,一个锁或者channel
就搞定了)
每个 Cond 都会关联一个Lock( *sync.Mutex or *sync.RWMutex)
,当修改条件或者调用Wait
方法时,必须加锁,保护condition
。
func (c *Cond) Broadcast()
Broadcast 会唤醒所有等待 c 的 goroutine。调用 Broadcast 的时候,可以加锁,也可以不加锁。
func (c *Cond) Signal()
Signal 只唤醒 1 个等待 c 的 goroutine。调用 Signal 的时候,可以加锁,也可以不加锁。
func (c *Cond) Wait()
Wait()会自动释放 c.L 锁,并挂起调用者的 goroutine。之后恢复执行,Wait()会在返回时对 c.L 加锁。
除非被 Signal 或者 Broadcast 唤醒,否则 Wait()不会返回。
由于 Wait()第一次恢复时, C.L 并没有加锁,所以当 Wait 返回时,调用者通常并不能假设条件为真。如下代码:
c.L.Lock()
for !condition() {
c.Wait()
}
... make use of condition ...
c.L.Unlock()
取而代之的是, 调用者应该在循环中调用 Wait。(简单来说,只要想使用condition,就必须加锁。)
一个 WaitGroup 对象可以等待一组协程结束。 使用方法是:
sync.Once 只暴露了一个方法 Do,你可以多次调用 Do 方法,但是只有第一次调用 Do 方法时 f 参数才会执行,这里的 f 是一个无参数无返回值的函数。
原子操作即是进行过程中不能被中断的操作,针对某个值的原子操作在被进行的过程中,CPU 绝不会再去进行其他的针对该值的操作。为了实现这样的严谨性,原子操作仅会由一个独立的 CPU 指令代表和完成。原子操作是无锁的,常常直接通过 CPU 指令直接实现。
事实上,其它同步技术的实现常常依赖于原子操作。
原子操作由底层硬件支持,而锁则由操作系统的调度器实现。
锁应当用来保护一段逻辑,对于一个变量更新的保护。
原子操作通常执行上会更有效率,并且更能利用计算机多核的优势,如果要更新的是一个复合对象,则应当使用 atomic.Value 封装好的实现。
CAS 的全称为 Compare And Swap,直译就是比较交换。是一条 CPU 的原子指令,其作用是让 CPU 先进行比较两个值是否相等,然后原子地更新某个位置的值,其实现方式是给予硬件平台的汇编指令,在 intel 的 CPU 中,使用的cmpxchg
指令,就是说 CAS 是靠硬件实现的,从而在硬件层面提升效率。
简述过程是这样:
假设包含 3 个参数内存位置(V)、预期原值(A)和新值(B)。 V 表示要更新变量的值, E 表示预期值, N 表示新值。仅当 V 值等于 E 值时,才会将 V 的值设为 N,如果 V 值和 E 值不同,则说明已经有其他线程在做更新,则当前线程什么都不做,最后 CAS 返回当前 V 的真实值。 CAS 操作时抱着乐观的态度进行的,它总是认为自己可以成功完成操作。基于这样的原理, CAS 操作即使没有锁,也可以发现其他线程对于当前线程的干扰。
对于很多需要重复分配、回收内存的地方,sync.Pool
是一个很好的选择。频繁地分配、回收内存会给GC
带来一定的负担,严重的时候会引起CPU
的毛刺。
而sync.Pool
可以将暂时将不用的对象缓存起来,待下次需要的时候直接使用,不用再次经过内存分配,复用对象的内存,减轻GC
的压力,提升系统的性能。
Golang在语言级别支持协程,称之为Goroutine
。 Golang 标准库提供的所有系统调用操作(包括所有的同步I/O
操作),都会出让CPU
给其他Goroutine。这让Goroutine
的切换管理不依赖于系统的线程和进程,也不依赖于CPU
的核心数量,而是交给Golang
的运行时统一调度。
G( Goroutine)
: 我们所说的协程,为用户级的轻量级线程,每个Goroutine
对象中的sched
保存着其上下文信息。
M( Machine)
: 对内核级线程的封装,数量对应真实的 CPU 数(真正干活的对象)。
P( Processor)
: 即为 G 和 M 的调度对象,用来调度 G 和 M 之间的关联关系,其数量可通过 GOMAXPROCS()来设置,默认为核心数。
调度器把 G 都分配到 M 上,不同的 G 在不同的 M 并发运行时,都需要向系统申请资源,比如堆栈内存等,因为资源是全局的,就会因为资源竞争照成很多性能损耗。为了解决这一的问题 go 从 1.1 版本引入,在运行时系统的时候加入 p对象,让 P 去管理这个 G 对象, M 想要运行 G,必须绑定 P,才能运行 P 所管理的 G。
GM 调度存在的问题:
1. 单一全局互斥锁( Sched.Lock) 和集中状态存储
2. Goroutine 传递问题( M 经常在 M 之间传递” 可运行” 的 goroutine)
3. 每个 M 做内存缓存,导致内存占用过高,数据局部性较差
4. 频繁 syscall 调用,导致严重的线程阻塞/解锁,加剧额外的性能损耗。
获取 P 本地队列,当从绑定 P 本地 runq 上找不到可执行的 g,尝试从全局链表中拿,再拿不到从 netpoll 和事件池里拿,最后会从别的 P 里偷任务。 P此时去唤醒一个 M。 P 继续执行其它的程序。 M 寻找是否有空闲的 P,如果有则将该 G 对象移动到它本身。接下来 M 执行一个调度循环( 调用 G 对象->执行->清理线程→继续找新的 Goroutine 执行)
当本线程 M 因为 G 进行的系统调用阻塞时,线程释放绑定的 P,把 P 转移给其他空闲的 M 执行。
细节: 当发生上线文切换时,需要对执行现场进行保护,以便下次被调度执行时进行现场恢复。 Go 调度器 M 的栈保存在 G 对象上,只需要将 M 所需要的寄存器( SP、 PC 等) 保存到 G 对象上就可以实现现场保护。当这些寄存器数据被保护起来,就随时可以做上下文切换了,在中断之前把现场保存起来。如果此时G 任务还没有执行完, M 可以将任务重新丢到 P 的任务队列,等待下一次被调度执行。当再次被调度执行时, M 通过访问 G 的 vdsoSP、 vdsoPC 寄存器进行现场恢复( 从上次中断位置继续执行) 。
在 1.14 版本之前,程序只能依靠 Goroutine 主动让出 CPU 资源才能触发调度。这种方式存在问题有:
在任何情况下, Go 运行时并行执行(注意,不是并发)的 goroutines 数量是小于等于 P 的数量的。为了提高系统的性能, P 的数量肯定不是越小越好,所以官方默认值就是 CPU 的核心数,设置的过小的话,如果一个持有 P 的 M,由于 P 当前执行的 G 调用了 syscall 而导致 M 被阻塞,那么此时关键点:
P
什么也不干,sysmon
最慢要 10-20ms才能发现这个阻塞,说不定那时候阻塞已经结束了,这样宝贵的 P 资源就这么被阻塞的 M 浪费了。Sysmon 也叫监控线程,变动的周期性检查,好处
我们首先看一张图,大概就会对 三色标记法有一个大致的了解:
原理:
首先把所有的对象都放到白色的集合中
Go 在进行三色标记的时候并没有 STW,也就是说,此时的对象还是可以进行修改。
那么我们考虑一下,下面的情况。
我们在进行三色标记中扫描灰色集合中,扫描到了对象 A,并标记了对象 A 的所有引用,这时候,开始扫描对象 D 的引用,而此时,另一个 goroutine 修改了 D->E 的引用,变成了如下图所示
这样会不会导致 E 对象就扫描不到了,而被误认为 为白色对象,也就是垃圾写屏障就是为了解决这样的问题,引入写屏障后,在上述步骤后, E 会被认为是存活的,即使后面 E 被 A 对象抛弃, E 会被在下一轮的 GC 中进行回收,这一轮 GC 中是不会对对象 E 进行回收的。
Go GC 在混合写屏障之前,一直是插入写屏障,由于栈赋值没有 hook 的原因,栈中没有启用写屏障,所以有 STW。 Golang 的解决方法是:只是需要在结束时启动 STW 来重新扫描栈。这个自然就会导致整个进程的赋值器卡顿。
Golang 没有这一步, Golang 的内存写屏障是由插入写屏障到混合写屏障过渡的。简单介绍一下,一个对象即使被删除了最后一个指向它的指针也依旧可以活过这一轮,在下一轮 GC 中才被清理掉。
主动触发:调用 runtime.GC
被动触发:
使用系统监控,该触发条件由 runtime.forcegcperiod 变量控制,默认为 2 分钟。当超过两分钟没有产生任何 GC 时,强制触发 GC。使用步调( Pacing)算法,其核心思想是控制内存增长的比例。如 Go 的 GC是一种比例 GC, 下一次 GC 结束时的堆大小和上一次 GC 存活堆大小成比例.
Go1.14 版本以 STW 为界限,可以将 GC 划分为五个阶段:
通过 go tool pprof 和 go tool trace 等工具