之前的一篇笔记曾分析过,Go的map在底层是用hashmap实现的。由于高效的hash函数肯定不是对key做顺序散列的,所以,与其它语言实现的hashmap类似,在使用Go语言map过程中,key-value的插入顺序与遍历map时key的访问顺序是不相同的。熟悉hashmap的同学对这个情况应该非常清楚。
所以,本文要提到的肯定不是这个,而是一个比较让人惊奇的情况,下面开始说明。
1. 通过range遍历map时,key的顺序被随机化
在golang 1.4版本中,借助关键字range对Go语言的map做遍历访问时,前后两轮遍历访问到的key的顺序居然是被随机化的!
这个现象在其它语言中是很少见的,比如C语言实现hashmap时,通常会用数组(即一段连续的内存空间)来存key,虽然key的分布顺序与插入顺序不一致,但k-v数据填充完毕后,整个hashmap的key的次序是固定的,所以,后续遍历这个hashmap时,每轮遍历访问到的key的顺序是一致的。
但Go语言通过range遍历map时,确实会对map的key顺序做随机化。下面是一段简单的验证程序。
// map_range_rand.go
package main
import (
"fmt"
)
func main() {
m := make(map[string]string)
m["hello"] = "echo hello"
m["world"] = "echo world"
m["go"] = "echo go"
m["is"] = "echo is"
m["cool"] = "echo cool"
for k, v := range m {
fmt.Printf("k=%v, v=%v\n", k, v)
}
}
在go v1.4环境中,执行go build map_range_rand.go完成编译后,运行产出的2进制文件,结果如下。
第1次运行输出:$ ./map_range_rand
k=is, v=echo is
k=cool, v=echo cool
k=hello, v=echo hello
k=world, v=echo world
k=go, v=echo go
第2次运行输出:
$ ./map_range_rand
k=go, v=echo go
k=is, v=echo is
k=cool, v=echo cool
k=hello, v=echo hello
k=world, v=echo world
第3次运行输出:
$ ./map_range_rand
k=hello, v=echo hello
k=world, v=echo world
k=go, v=echo go
k=is, v=echo is
k=cool, v=echo cool
可以很清楚地看到,每次遍历时,key的顺序都是不同的。
2. 业务依赖key次序时,如何解决随机化问题
其实Go maps in action一文已经给出了解决方法:package main
import (
"fmt"
"sort"
)
func main() {
m := make(map[string]string)
m["hello"] = "echo hello"
m["world"] = "echo world"
m["go"] = "echo go"
m["is"] = "echo is"
m["cool"] = "echo cool"
sorted_keys := make([]string, 0)
for k, _ := range m {
sorted_keys = append(sorted_keys, k)
}
// sort 'string' key in increasing order
sort.Strings(sorted_keys)
for _, k := range sorted_keys {
fmt.Printf("k=%v, v=%v\n", k, m[k])
}
}
上面的示例中,通过引入sort对key做排序,然后根据有序的keys遍历map即可保证每次遍历map时的key顺序是固定的。
$ go build map_range_rand.go
可以验证,每次的执行结果中key的次序都是按字典序进行升序排列的:
$ ./map_range_rand
k=cool, v=echo cool
k=go, v=echo go
k=hello, v=echo hello
k=is, v=echo is
k=world, v=echo world
【参考资料】
Go Blog - Go maps in action
=========================== EOF ==========================