• Go语言各种扩容机制(防止混淆)


    Slice扩容

    触发

    使用append向Slice追加元素时,如果Slice空间不足,将会触发Slice扩容

    原理

    扩容实际上是重新分配一块更大的内存,将原Slice数据拷贝进新Slice,然后返回新Slice,扩容后再将数据追加进去。

    机制

    V1.8之前:

    扩容容量的选择遵循以下规则:

    • 如果原Slice容量小于1024,则新Slice容量将扩大为原来的2倍;
    • 如果原Slice容量大于等于1024,则新Slice容量将扩大为原来的1.25倍;
    1. // 1.17及以前的版本中
    2. // old指切片的旧容量, cap指期望的新容量
    3. func growslice(old, cap int) int {
    4. newcap := old
    5. doublecap := newcap + newcap
    6. // 如果期望容量大于旧容量的2倍,则直接使用期望容量作为最终容量
    7. if cap > doublecap {
    8. newcap = cap
    9. } else {
    10. // 如果旧容量小于1024,则直接翻倍
    11. if old < 1024 {
    12. newcap = doublecap
    13. } else {
    14. // 每次增长大约1.25倍
    15. for 0 < newcap && newcap < cap {
    16. newcap += newcap / 4
    17. }
    18. if newcap <= 0 {
    19. newcap = cap
    20. }
    21. }
    22. }
    23. // 这里忽略了对齐操作
    24. return newcap
    25. }

    V1.8之后:

    新扩容容量的选择遵循以下规则:(拥有更平滑的扩容系数)

    • 如果原Slice容量小于256,则新Slice容量将扩大为原来的2倍;
    • 如果原Slice容量大于等于256,则新Slice容量将扩大为原来的  新容量 = (原容量+3*256)/4
    1. // 只关心扩容规则的简化版growslice
    2. func growslice(old, cap int) int {
    3. newcap := old
    4. doublecap := newcap + newcap
    5. if cap > doublecap {
    6. newcap = cap
    7. } else {
    8. const threshold = 256 // 不同点1
    9. if old < threshold {
    10. newcap = doublecap
    11. } else {
    12. for 0 < newcap && newcap < cap {
    13. newcap += (newcap + 3*threshold) / 4 // 不同点2
    14. }
    15. if newcap <= 0 {
    16. newcap = cap
    17. }
    18. }
    19. }
    20. return newcap
    21. }

    Map扩容

    触发扩容的条件有二个:

    1. 负载因子 > 6.5时,也即平均每个bucket存储的键值对达到6.5个。增量扩容
    2. overflow数量 > 2^15时,也即overflow数量超过32768时。等量扩容/重排

    注意:创建溢出桶不属于扩容机制

    增量扩容

    • 当负载因子过大时,新开辟buckets空间,bucket数量为之前的 2 倍
    • 新空间被buckets引用,之前的旧空间被oldbuckets引用
    • 之后逐渐将 oldbuckets中的数据 搬迁到 新开辟的 buckets空间中去

    考虑到如果map存储了数以亿计的key-value,一次性搬迁将会造成比较大的延时,Go采用逐步搬迁策略,即每次访问map时都会触发一次搬迁,每次搬迁2个键值对当oldbuckets中的键值对全部搬迁完毕后,删除oldbuckets。

    下图展示了包含一个bucket满载的map(为了描述方便,图中bucket省略了value区域):

    当前map存储了7个键值对,只有1个bucket。此时负载因子为7 > 6.5。再次插入数据时将会触发扩容操作,扩容之后再将新插入键写入新的bucket。注意,因为负载因子的触发,不是创建溢出桶

    当第8个键值对插入时,将会触发扩容扩容后示意图如下:

    后续对map的访问操作会触发迁移,将oldbuckets中的键值对逐步的搬迁过来。

    搬迁完成后的示意图如下:

    数据搬迁过程中原bucket中的键值对将存在于新bucket的前面,新插入的键值对将存在于新bucket的后面。

    等量扩容/重排

    所谓等量扩容,实际上并不是扩大容量,buckets数量不变,重新做一遍类似增量扩容的搬迁动作,把松散的键值对重新排列一次,以使bucket的使用率更高,进而保证更快的存取。
    在极端场景下,比如不断地增删,而键值对正好集中在一小部分的bucket,这样会造成overflow的bucket数量增多,但负载因子又不高,从而无法执行增量搬迁的情况,如下图所示:

    上图可见,overflow的bucket中大部分是空的,访问效率会很差。此时进行一次等量扩容,即buckets数量不变,经过重新组织后overflow的bucket数量会减少,即节省了空间又会提高访问效率。

  • 相关阅读:
    Go | 函数注意事项
    配置 整理
    Socks5与HTTP的区别与应用场景
    压力测试-Jmeter脚本录制方案
    DCM:一个能够改善所有应用数据交互场景的中间件新秀
    C++学习6-类和对象
    思科 Packet Tracer实验(一)
    第二章:Pythonocc官方demo 案例44(几何板条)
    Android---网络编程优化
    Pytorch从零开始实现Vision Transformer (from scratch)
  • 原文地址:https://blog.csdn.net/qq_48826531/article/details/126902222