Go语言学习之string、数组与slice

string

string在Go语言内存模型中用2字长(不同CPU,字长不同)的数据结构表示,与C++ STL实现的string类似,由指向固定地址的str指针和表示字符串长度的len组成。

type string struct {
  var strptr  unitptr
  var strlen  uint 
}

因此,对string的赋值以及作为函数的参数传递,都只是指针的传递,实际指向相同的底层数据。在Go语言中,string类型是不可变,所以多字符串共享同一个存储数据是安全的。

可以理解为go的string变量被编译器分配到只读段,对应的数据地址不可写入。但实际如果对string变量做修改,编译器就会报错,比如cannot assign to str[0]

数组

数组的长度是固定的,长度是数组类型的组成部分,即[4]int与[5]int是完全不同的类型。
数组不用显示的初始化,数组元素会自动初始化为其对应元素类型的零值。
数组对应内存是连续的,以[4]int为例,其对应内存中4个连续的整型数据。


go中的数组是值语义,与C/C++不同,一个数组变量表示整个数组,而不是指向第一个数组元素的指针,所以当一个数组变量被赋值或传递时,实际上会复制整个数组。我们在写函数时,根据实际的需要来决定函数入参是否用数组指针。但是当数组比较大时,建议使用数组指针,避免复制数组带来的开销。

slice

slice是基于数组构建的,写法是[]TT为元素类型。声明上与数组唯一不同的是slice类型没有指定元素个数。

sli := []byte("abc")

slice可以通过内置函数make创建,make函数内部会分配一个数组,然后返回这个数组对应的切片

s := make([]byte, 5, 5)

当容量参数被忽略时,默认与长度一致。

s := make([]byte, 5) //与 make([]byte, 5, 5)相同

slice通过内置函数new([]T)初始化时,new函数返回的是指向slice的指针,不能直接进行下标操作。

sp := new([]int)  //内存分配并置零,不能直接下标操作
var s []int  //s默认值为nil,也不能直接下标操作

sp为slice类型指针,s为slice类型,caplen都为0。
new函数用C来描述,相当于:

T* t = (T*)malloc(sizeof(T))
memset(t, 0, sizeof(T))

slice的零值是nil,对于slice的零值,lencap都将返回0。
slice可以基于现有的string、slice或数组生成。slice的范围由两个冒号分隔的索引对应的半开区间[a,b)指定。

str := "abcde"
sli1 := str[:]  //基于string类型生成
array := [3]string{"abc","def", "ghi"}
sli2 := array[0:2]  //基于数组类型生成
s := []byte("abcde")
sli3 := s[:]  //基于slice类型生成
slice内部实现

slice通过内部指针和相关属性引用数组片段,其扩展方式和数据结构与C++的vector很相似。slice本身是结构体,作为参数传递时传递的是slice本身而不是其引用的底层数据,因此表现是引用语义,但结构体本身是值语义。

type slice struct {
  var array unsafe.Pointer
  var len int
  var cap int
}


一个slice是一个数组片段的描述,其包含了指向数组的指针,片段的长度以及自身容量。
slice结构中,len为slice引用的元素数目,cap为slice底层元素的数目。

s := array[2:4]

slice并不复制slice指向的元素,它创建一个新的slice并复用底层数组,使得slice操作和数组索引一样高效。

s2 := s1[1:3]  //s1为slice 

增加slice长度时,不能超过容量,否则会运行异常。

s = s[:cap(s)]

如果添加元素会超过slice容量,则需要使用append函数,重新分配内存,底层数组进行复制,此时新的slice与原始slice内存不同,相互不影响。

问题

slice操作不会复制底层的数组而是引用,因此整个数组会保存在内存中,直到它不再被引用才会被释放。所以有可能slice操作只是引用很小的内存导致保存所有内存,比如s2 := s1[1:3],而s1的底层数组占很大的内存,由于s2引用了s1的一小部分,s1会保存在内存中。

如何避免
s2 := make([]byte, len(s1[1:3]))
copy(s2, s1[1:3])
string与[]byte的转化

在go语言编码过程中,经常将两者进行转换,每次相互转化都会发生底层数据的复制,但性能损失。

//string 转 []byte
str := "123"
sli := []byte(str)
//[]byte转string
str = string([]byte)

关于string与[]byte转换的问题,后面再讨论。

你可能感兴趣的:(Go语言学习之string、数组与slice)