for-range其实是正常for循环的一种语法糖,在go语言中可以遍历arr,slice,map和channel等数据结构,但是在一些初学者使用for-range可能会遇见很多坑,这篇文章会带你探索一下for-range中非常有趣的一些实现机制。
先来看两道题目:
arr := [2]int{1, 2}
res := []*int{}
for _, v := range arr {
res = append(res, &v)
}
//expect: 1 2
fmt.Println(*res[0],*res[1])
//but output: 2 2
答案:从程序中可以看出我们预期输出的为1、2,但实际上却输出了2、2的答案。
v := []int{1, 2, 3}
for i := range v {
v = append(v, i)
}
答案:上面代码遍历是会停止的。
好了,可能有些朋友看完上面两段代码的最终结果已经开始疑惑了,接下来我们来看一下for-range对
数组和slice的处理方法。
// len_temp := len(range)
// range_temp := range
// for index_temp = 0; index_temp < len_temp; index_temp++ {
// value_temp = range_temp[index_temp]
// index = index_temp
// value = value_temp
// original body
// }
看上面这段源代码我们可以看出,for-range内部调用其实还是for循环,初始化会拷贝待遍历的列表,然后每次遍历的v
都是对上面源码value_temp
这同一个元素的赋值。
题1
中为什么输出的会是2、2,对题1
中v
取地址,最终只会拿到一个地址(实际地址:&value_temp),而对应的值就是最后遍历的那个元素所附给v
的值。想得到预期值有两种方案:
for _, v := range arr {
//局部变量v替换了v,也可用别的局部变量名
v := v
res = append(res, &v)
}
//这种其实退化为for循环的简写
for k := range arr {
res = append(res, &arr[k])
}
题2
也就很好说明了,因为遍历次数在遍历前就已经确定下来了(len_temp),所以题2
最终只会循环三次。还是先看两道题目:
var m = map[int]int{1: 1, 2: 2, 3: 3}
var o sync.Once
for i := range m {
o.Do(func() {
for _, key := range []int{1, 2, 3} {
if key != i {
fmt.Printf("when iteration key %d, del key %d\n", i, key)
delete(m, key)
break
}
}
})
fmt.Printf("%d%d ", i, m[i])
}
答案:如果删除的元素还没有被遍历到(上边once.go
函数内保证第一次执行时删除未遍历的一个元素),那么后面就不会出现。因为我们都知道map在for-range遍历中是无序遍历的,这是因为map底层数据结构就是一个链式hash表,并且初始化的时候会随机一个遍历开始的位置,所以如果还没被遍历到的元素已经被删除了,那么后面也肯定不会再出现。
var m = map[int]int{1:1, 2:2, 3:3}
for i, _ := range m {
m[4] = 4
fmt.Printf("%d%d ", i, m[i])
}
答案:输出中可能会有44
,原因是因为上一条题目中原因类似(链式hash表,随机遍历开始位置)。
好了,我们再来看一下golang中for-range对map的处理方法。
// The loop we generate:
// var hiter map_iteration_struct
// for mapiterinit(type, range, &hiter); hiter.key != nil; mapiternext(&hiter) {
// index_temp = *hiter.key
// value_temp = *hiter.val
// index = index_temp
// value = value_temp
// original body
// }
遍历map时没有指定循环次数,循环体是和slice类似的。由于map底层实现与slice不同,map底层使用hash表实现,插入数据位置是随机的,所以遍历过程中新插入的数据不能保证被遍历到。
for-range对channel的处理
// The loop we generate:
// for {
// index_temp, ok_temp = <-range
// if !ok_temp {
// break
// }
// index = index_temp
// original body
// }
channel遍历是依次从channel中读取数据,读取前是不知道里面有多少个元素的。如果channel中没有元素,则会阻塞等待,如果channel已被关闭,则会解除阻塞并退出循环。
注意: