有很多gopher将切片的length和capacity混淆,没有彻底理清这两者的区别和联系。理清楚切片的长度和容量这两者的关系,有助于我们合理的对切片进行初始化、通过append追加元素以及进行复制等操作。如果没有深入理解它们,缺少高效操作切片的方法,甚至可能导致内存泄露。
Go语言中切片的底层是一个数组,也就是说切片中的元素在内存中是连续存储的。如果底层数组元素已满,继续向切片中添加元素,切片会进行扩容操作。在内部实现上,切片包含一个指向底层数组的指针,一个记录数组长度的字段和一个记录数组容量的字段。长度记录的是切片中已添加的元素数量,而容量记录的是数组大小。
下面结合几个具体的程序进行理解。首先来初始化一个给定长度和容量的切片:
s := make([]int, 3, 6)
通过make函数创建切片,它的第一个参数(3)表示切片的长度,是必传参数。第二个参数(6)是非必传参数,该参数表示切片的容量。下图展示了切片s在内存中的分配结果。
s的底层是一个包含6个元素(容量)的数组,但是因为长度设置为3,所以只初始化了前3个元素。又因为切片中的元素是int类型,所以初始的值为int的类型零值:0. 上图中灰色的格子表示已分配内存但尚未使用。
如果打印切片s的值,得到输出内容是长度范围内的元素值,即[0 0 0]. 如果将s[1]设置为1,则切片中的第二个元素内容会被更新为1,但不会影响切片s的长度和容量。
访问切片中的元素位置超过切片的长度是不被允许的,将会产生panic, 尽管已经分配的元素个数(切片的容量)比长度大。 例如,下面执行 s[4]=0将会产生pani.
panic: runtime error: index out of range [4] with length 3
那如何使用剩余灰色的3个空间呢?通过内置的append函数向切片中添加元素。
s = append(s, 2)
可以看到,通过append操作,切片s中添加了一个新的元素2. 元素2存在s中已分配但未使用的空间中(即数组中第4个格子)。如下图所示。此时s的长度变为4.
如果继续向s添加元素3、4、5, 这个时候元素个数已超过预分配的大小6,此时如何处理呢?
s = append(s, 3, 4, 5)
fmt.Println(s)
执行上面的代码,可以看到输出结果与我们预期的一致,打印 [0 1 0 2 3 4 5].
因为数组是一种大小固定的数据结构,s底层是一个大小为6的数组,所以它只能存储到元素4. 当向里面插入元素5的时候,它已经满了,这时将创建一个新的数组,数组的大小是原来的两倍,然后将原来数组中的元素拷贝到新数组中,最后向新数组中插入元素。处理结果如下图。
NOTE:在Go语言中,切片在扩容时,新切片的容量大小是旧切片的两倍,直到容量大小为1024,当容量超过1024时,按原来的1.25倍进行扩容。
现在切片s底层关联的是一个新数组,那之前的数组会怎么处理呢?如果它不再被引用,并且是在堆上分配的,则最后将被垃圾回收器(GC)回收。
切片截取操作,截取操作的对象是一个数组或切片,从中截取一部分数据,截取的范围是左闭右开区间。下面的代码中,s2是通过截取s1得到的,在内存的结构如下图所示。
s1 := make([]int, 3, 6)
s2 := s1[1:3]
s1是一个长度为3,容量为6的切片,切片s2是通过s1创建的,两个切片底层引用的是相同的数组。但是,s2下标索引从底层数组的索引1开始,并且容量也与s1不同。如果我们对s1[1]或s2[0]进行更新操作,它们更改的是的底层数组的相同位置值,所以对s1[1]进行更新,将其设置为1,s2[0]的值也同步更新了,此时内存结构如下图所示。
如果此时执行 s2 = append(s2,2)操作,切片s1会发生变化吗?虽然它们共享的底层数组中的元素已发生变化,第4个格子中的元素被设置为2,但是该索引位置对s1是不可见的,因为它的长度为3, 此时s1和s2在内存中的结构如下。
现在打印s1和s2的值,输出如下。可以看到,它们的值是不同的,理解这种行为很重要,这样在使用append时就不会做出错误的假设。
s1=[0 1 0], s2=[1 0 2]
NOTE: 切片的底层数组是内部实现,Go开发人员是无法直接操作访问的。唯一的例外是通过对现有数组创建切片。
最后要考虑的一件事是,如果我们不断的将元素append到切片s2中,直到底层数组已满。继续append会产生什么效果?下面通过实验进行说明,继续向s2中append 3个元素.
s2 = append(s2, 3)
s2 = append(s2, 4)
s2 = append(s2, 5)
这样导致会分配一个新的底层数组给s2,因为原来的底层数组已不够容纳元素3、4、5. 此时s1和s2在内存中的结构如下图所示。可以看到,此时s1和s2底层引用的是不同的数组。由于s1是一个长度为3、容量为6的切片,并且它里面装的元素未满,所以继续引用原来的数组。s2新关联新的数组,并且会将s1中与之关联的数据拷贝到新数组中。
切片长度是切片中已有元素的数量,而切片容量是切片中可以容纳的元素数量。向切片中添加元素,当长度和容量相等时会导致创建具有新容量的新底层数组,复制所有来自前一个数组的元素,并将切片指针更新为新数组。