并发容器线程安全应对之道-ConcurrentHashMap

2 并发容器线程安全应对之道

引言
在前面，我们学习了hashmap
大家都知道HashMap不是线程安全（put、删除、修改、递增、扩容都无锁）的
所以在处理并发的时候会出现问题
接下来我们看下J.U.C包里面提供的一个线程安全并且高效Map（ConcurrentHashMap）
看一下，他到底是如何实现线程并发安全的
1
2
3
4
5
6

2.1 并发容器总体概述

**目标：**学习ConcurrentHashMap基本概念和认识它的数据结构

ConcurrentHashMap概念：

ConcurrentHashMap是J.U.C包里面提供的一个线程安全的HashMap，在并发编程中使用的频率（Spring）比较高。

数据结构如下

数组+链表+红黑树+锁（synchronized+cas）

file

总结：

1、数据结构和hashmap一模一样，唯一的区别就是concurrenthashmap在put、删除、修改、递增、扩容和数据迁移的时候都加锁了（syn or cas）

2、加锁只是锁住一个元素，区别于HashTable(整个表，idea可以查看源码来验证)

2.2 并发容器数据结构与继承

目标：

简单认识下ConcurrentHashMap继承关系

file
总结

ConcurrentHashMap：实现Serializable表示支持序列化

继承AbstractMap（实现map接口），实现了一些基本操作

实现ConcurrentMap接口，封装了map的基本操作

2.3 并发容器源码深度剖析

测试代码

见put部分
1

2.3.1 并发容器成员变量

**目标：**认识下ConcurrentHashMap成员变量，先有个印象，方便后续源码分析

private static final int MAXIMUM_CAPACITY = 1 << 30; //table最大容量：2^30=1073741824
private static final int DEFAULT_CAPACITY = 16; //默认容量，必须是2的幂数
static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8; 数组的建议最大值
private static final int DEFAULT_CONCURRENCY_LEVEL = 16; //并发级别，1.8前的版本分段锁遗留下来的，为兼容以前的版本
static final int TREEIFY_THRESHOLD = 8;// 链表转红黑树阀值
static final int UNTREEIFY_THRESHOLD = 6;// 树转链表阀值
static final int MIN_TREEIFY_CAPACITY = 64;// 转化为红黑树的表的最小容量
private static final int MIN_TRANSFER_STRIDE = 16;// 每次进行转移的最小值
//咦？threshold 呢？？？
1
2
3
4
5
6
7
8
9

2.3.2 并发容器构造器

目标：

先认识下ConcurrentHashMap的5个构造器，看下在构造中（第一步）做了哪些事情

1、ConcurrentHashMap()型构造函数

 　public ConcurrentHashMap() {  

　}

1
2
3
4

**总结：**该构造函数用于创建一个带有默认初始容量 (16)、负载因子 (0.75) 的空映射

2、ConcurrentHashMap(int)型构造函数

private static final int MAXIMUM_CAPACITY = 1 << 30
    
public ConcurrentHashMap(int initialCapacity) {

        if (initialCapacity < 0) // 初始容量小于0，抛出异常
            throw new IllegalArgumentException();
  			//到达最大容量的一半以上后，直接取最大容量！
        int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
                   MAXIMUM_CAPACITY :
                   tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1)); 
        // 初始化，sizeCtl是什么鬼？？看上去是容量……
        this.sizeCtl = cap;
    }
1
2
3
4
5
6
7
8
9
10
11
12
13

总结：该构造函数用于创建一个带有指定初始容量的map

3、ConcurrentHashMap(Map)型构造函数

    public ConcurrentHashMap(Map<? extends K, ? extends V> m) {
      	this.sizeCtl = DEFAULT_CAPACITY;
        // 将集合m的元素全部放入
        putAll(m);
    }
1
2
3
4
5

总结：该构造函数用于构造一个与给定映射具有相同映射关系的新映射。

4、ConcurrentHashMap(int, float)型构造函数

    public ConcurrentHashMap(int initialCapacity, float loadFactor) {
      this(initialCapacity, loadFactor, 1);
    }
1
2
3

总结：该构造函数用于创建一个带有指定初始容量、加载因子新的空映射。

5、ConcurrentHashMap(int, float, int)型构造函数

public ConcurrentHashMap(int initialCapacity,
                             float loadFactor, int concurrencyLevel) {
        if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0) // 合法性判断
            throw new IllegalArgumentException();
        if (initialCapacity < concurrencyLevel)   // Use at least as many bins
            initialCapacity = concurrencyLevel;   // as estimated threads
        long size = (long)(1.0 + (long)initialCapacity / loadFactor);
        int cap = (size >= (long)MAXIMUM_CAPACITY) ?
            MAXIMUM_CAPACITY : tableSizeFor((int)size);
        this.sizeCtl = cap; // 好像是容量？没那么简单，待会往下看
    }
1
2
3
4
5
6
7
8
9
10
11

总结：该构造函数用于创建一个带有指定初始容量、加载因子和并发级别的新的空映射

扩展：和HashMap完全一样？错！我们来看一个实例

1）代码实例

package com.cmap;

import org.openjdk.jol.info.ClassLayout;

import java.util.HashMap;
import java.util.concurrent.ConcurrentHashMap;

public class CMapInit {
    public static void main(String[] args) {
        HashMap m = new HashMap(15,0.5f);
        ConcurrentHashMap cm = new ConcurrentHashMap(15, 0.5f);

      	//debug here
        System.out.println("before put");

        m.put(1,1);
        cm.put(1,1);

      	//and here
        System.out.println("after put");
        System.out.println(ClassLayout.parseInstance(cm).toPrintable());

    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

2）调试，put之前
file

3）继续，debug到第二步试试，put之后

file

容量并不是我们之前认为的16，而是32
而sizeCtl，我们理解，应该类比于hashMap中的threshold，它应该等于 32*0.5=16才对
可是最终为24

这是什么神操作？？？

4）原理剖析

先说结论：方法调用的都是tableSizeFor，只不过，Cmap所计算的参数不一样，注意回顾上面的构造函数

    public ConcurrentHashMap(int initialCapacity,
                             float loadFactor, int concurrencyLevel) {
        if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)
            throw new IllegalArgumentException();
        if (initialCapacity < concurrencyLevel)   // Use at least as many bins
            initialCapacity = concurrencyLevel;   // as estimated threads
      	//initial = 15, size = 31
        long size = (long)(1.0 + (long)initialCapacity / loadFactor);
      	//所以tableSizeFor做满1运算前，并不是15本身，而是size，也就是31
      	//运算后，cap=32 ， 不是16
        int cap = (size >= (long)MAXIMUM_CAPACITY) ?
            MAXIMUM_CAPACITY : tableSizeFor((int)size);
        this.sizeCtl = cap;
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14

那么它啥时候变成24的呢？

//开始之初，table为null，在put时，会触发table的初始化，也就是以下方法
//从put方法的入口可以追踪到，我们猜想它肯定在这里，初始化table的时候
private final Node<K,V>[] initTable() {
        Node<K,V>[] tab; int sc;
        while ((tab = table) == null || tab.length == 0) {
          	//sc = 原来的sizeCtl也就是 32
            if ((sc = sizeCtl) < 0)
                Thread.yield(); // lost initialization race; just spin
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                try {
                    if ((tab = table) == null || tab.length == 0) {
                      	//n = sc = 32  , 默认就是default=16了
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                        @SuppressWarnings("unchecked")
                      	//创建node数组，长度为n，也就是32
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                      	//创建完复制给table，初始化完成，也就是我们看到的32长度的数组
                        table = tab = nt;
                      	// n >>> 2 ，相当于n除以4是8， 32-8=24
                      	//实际效果相当于，n* 3/4 ， 也就是 n*0.75 ， 你指定的0.5在初始化时对它没什么用！
                        sc = n - (n >>> 2);
                    }
                } finally {
                  	//在finally中将它赋给了sizeCtl，也就是我们最终看到的24
                    sizeCtl = sc;
                }
                break;
            }
        }
        return tab;
    }

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

那么sizeCtl起不到threshold的作用，它是干嘛的呢？

其实它的作用远远比hashmap中的thredhold大的多，看看官方的说法：

  /**
     * Table initialization and resizing control.  When negative, the
     * table is being initialized or resized: -1 for initialization,
     * else -(1 + the number of active resizing threads).  Otherwise,
     * when table is null, holds the initial table size to use upon
     * creation, or 0 for default. After initialization, holds the
     * next element count value upon which to resize the table.
     */
    private transient volatile int sizeCtl;

1
2
3
4
5
6
7
8
9
10

翻译过来就是这样子：（官方就这么规定的，记住它！）

用来控制table的初始化和扩容操作
默认为0，int类型的，废话
-1 代表table正在初始化
-N 表示有N-1个线程正在进行扩容操作

其余情况：

如果table未初始化，表示table需要初始化的大小。
如果table初始化完成，表示table的容量，默认是table大小的0.75倍

而修改它的方法也比较多，initTable只是其中的一个：

initTable()
addCount（）
tryPresize（）
transfer（）
helpTransfer（）

2.3.3 put方法

**目标：**1、ConcurrentHashMap增加的逻辑是什么

2、ConcurrentHashMap是如何保证线程安全的

基础回顾：关于compareAndSwapInt（CAS）

一定要理解CAS的原理，Cmap的精髓就在于cas和sync保障了线程安全，下文的源码分析马上要用到它

（画图展示两个线程的cas交互操作）

(U.compareAndSwapInt(this, SIZECTL, sc, -1))
1

file
解释：

此方法是Java的native方法，并不由Java语言实现。
方法的作用是，读取传入对象this在内存中偏移量为SIZECTL位置的值与期望值sc作比较。
相等就把-1值赋值给SIZECTL位置的值。方法返回true。
不相等，就取消赋值，方法返回false。
一般配合循环重试操作，被for或while所包裹

1）测试代码

package com.cmap;

import java.util.ArrayList;
import java.util.ConcurrentModificationException;
import java.util.HashMap;
import java.util.List;
import java.util.concurrent.ConcurrentHashMap;

public class CMapTest {
    static final int HASH_BITS = 0x7fffffff; // usable bits of normal node hash

    public static void main(String[] args) {
        ConcurrentHashMap<Integer, Integer> m = new ConcurrentHashMap<Integer, Integer>();
        for (int i = 0; i < 64; i++) {

            if (i == 0) {
                m.put(i, i);//正常新增（演示）
            } else if (i == 11) {
                //容量默认16，临界值=12， 那么i=11正好是第12个值，引发扩容
                m.put(i, i);//扩容（演示）

            } else if (i == 10) {
                m.put(27, 27);
                m.put(43, 43);
            } else if (i == 9) {


            } else if(i==23){
                m.put(i,i);  // 23, 第二次扩容
            }else {
                m.put(i, i);//正常新增
            }
        }

        m.get(8);
        System.out.println(m);
    }

    //哈希冲突
    static void testHashCode() {
        System.out.println((16 - 1) & spread(new Integer(27).hashCode()));
        System.out.println((16 - 1) & spread(new Integer(43).hashCode()));
        System.out.println((16 - 1) & spread(new Integer(11).hashCode()));
    }

    static final int spread(int h) {
        return (h ^ (h >>> 16)) & HASH_BITS;
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

2）增加过程

file

//提示：该方法岔路比较多，要广度优先阅读，先看外围大路，再细分里面的子方法
final V putVal(K key, V value, boolean onlyIfAbsent) {
        if (key == null || value == null) throw new NullPointerException();
        int hash = spread(key.hashCode());//key取hash扰动
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {//循环直到成功
            Node<K,V> f; int n, i, fh; K fk; V fv;
            if (tab == null || (n = tab.length) == 0)
                tab = initTable();//表为空的话，初始化表，下面会详细介绍【预留1】
          	//寻址，找到头结点f
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                //cas在这里！！！
                //插槽为空，cas插入元素
                //比较是否为null，如果null才会设置并break，否则到else
                if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value)))
                    break; //插入成功，break终止即可，如果不成功，会进入下一轮for
            }
          
          	//helpTransfer() 扩容。下小节详细讲，一个个来……【预留2】
            else if ((fh = f.hash) == MOVED)
                tab = helpTransfer(tab, f);
            
            
            else {
                V oldVal = null;
                //synchronized 在这里！！！
                //插槽不为空，说明被别的线程put抢占了槽
                //那就加锁，锁的是当前插槽上的头节点f（类似分段锁）
                synchronized (f) {
                    if (tabAt(tab, i) == f) { //这步的目的是再次确认，链表头元素没有被其他线程动过
                        if (fh >= 0) {  // 正常节点的hash值
                            binCount = 1; //统计节点个数
                            //沿着当前插槽的Node链往后找
                            for (Node<K,V> e = f;; ++binCount) {
                                K ek;
                                //如果找到相同key，说明之前put过
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent) //abset参数来决定要不要覆盖，默认是覆盖
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                //否则，新key，新Node插入到最后
                                if ((e = e.next) == null) {
                                    pred.next = new Node<K,V>(hash, key, value);
                                    break;
                                }
                            }
                        }
                        //如果是红黑树，说明已经转化过，按树的规则放入Node
                        else if (f instanceof TreeBin) {
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                        else if (f instanceof ReservationNode)
                            throw new IllegalStateException("Recursive update");
                    }
                }
                if (binCount != 0) {
                    //如果节点数达到临界值，链表转成树
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount); //计数，如果超了，调transfer扩容
        return null;
    }
    
    //compareAndSetObject，比较并插入，典型CAS操作
    static final <K,V> boolean casTabAt(Node<K,V>[] tab, int i,
                                        Node<K,V> c, Node<K,V> v) {
        return U.compareAndSetObject(tab, ((long)i << ASHIFT) + ABASE, c, v);
    }


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88

3）初始化表方法

多线程下initTable的交互流程：
file

源码：

    /**
     * 注意点：先以单线程看业务流程，再类比多个线程操作下的并发是如何处理的？
     */
    private final Node<K,V>[] initTable() {
        Node<K,V>[] tab; int sc;
        while ((tab = table) == null || tab.length == 0) { //自旋
          
          	//第1个线程这个if不成立，会进入下面，设置为-1
          	//第2个线程来的时候if成立，注意理解多线程在跑。
            if ((sc = sizeCtl) < 0) //注意回顾上面的值，小于0表示正在初始化，或扩容
                Thread.yield();//有线程在操作，将当前线程yield让出时间片。唤醒后进入下一轮while
          
          	
          	//CAS操作来设置SIZECTL为-1，如果设置成功，表示当前线程获得初始化的资格
          	//传入对象 & 内存地址 &  期望值  & 将修改的值
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) { 
                try {                  
                    if ((tab = table) == null || tab.length == 0) {
                      	//再次确认一下，table是null，还没初始化
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;//默认容量16
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n]; //初始化table
                      	//给table赋值，注意这个table是volatile的，会被其他线程及时看到！
                      	//一旦其他线程看到不是null，走while循环发现table不等于空就return了
                        table = tab = nt;
                        sc = n - (n >>> 2); //计算下次扩容的阈值，容量的0.75
                    }
                } finally {
                    sizeCtl = sc;
                }
                break;
            }
        }
        return tab;
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

总结：

判断顺序为先看 table=null 再看 sizeCtl = -1
T1来得早，按部就班进行
T2 - T4 在不同时间点进入，行动不一样，有的是被cas挡住，有的被table非null挡住

2.3.4 扩容

**目标：**1、图解+断点分析查看ConcurrentHashMap是如何扩容的

2、图解+断点分析查看ConcurrentHashMap是如何迁移数据的

测试代码

package com.cmap;

import java.util.ArrayList;
import java.util.ConcurrentModificationException;
import java.util.HashMap;
import java.util.List;
import java.util.concurrent.ConcurrentHashMap;

public class CMapTest {
    static final int HASH_BITS = 0x7fffffff; // usable bits of normal node hash

    public static void main(String[] args) {
        ConcurrentHashMap<Integer, Integer> m = new ConcurrentHashMap<Integer, Integer>();
        for (int i = 0; i < 64; i++) {

            if (i == 0) {
                m.put(i, i);//正常新增（演示）
            } else if (i == 11) {
                
                m.put(i, i);//扩容 1

            } else if (i == 10) {
                m.put(27, 27);
                m.put(43, 43);
            } else if (i == 9) {


            } else if(i==23){
                m.put(i,i);  // 23, 第二次扩容（演示点，debug打在这里再进去）
            }else {
                m.put(i, i);//正常新增
            }
        }


        System.out.println(m);
    }


}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

入口：

/*
在上面， putVal方法的最后， 进 addCount()，再跳到最后，发现：
会走到 transfer() 方法，这是真正的扩容操作

同时，Cmap还带有它的特色，也就是 多线程协助扩容，helpTransfer
最后调的也是transfer方法

*/
final V putVal(K key, V value, boolean onlyIfAbsent) {
  // ……
  
  addCount(1L, binCount);
}

 private final void addCount(long x, int check) {
  	// ...
   
		// 扩容操作的核心在这里
    transfer(tab, null);
 }


/**
     * Helps transfer if a resize is in progress. 如果正在扩容，上去帮忙
     * tab = 旧数组， f=头结点，如果正在扩容，它是一个ForwardNode类型
*/
final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
    Node<K,V>[] nextTab; int sc;
    if (tab != null && (f instanceof ForwardingNode) &&
        (nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
        int rs = resizeStamp(tab.length);
        while (nextTab == nextTable && table == tab &&
               (sc = sizeCtl) < 0) {//一堆条件判断，不去管它
            if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                sc == rs + MAX_RESIZERS || transferIndex <= 0)
                break;
            //其他线程进来，多了这一步： cas将 sizeCtl + 1, （表示增加了一个线程帮助其扩容）
            if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
            		// 找到了，核心在这里！这个内部藏着扩容的具体操作
                transfer(tab, nextTab);
                break;
            }
        }
        return nextTab;
    }
    return table;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47

核心源码【重点】

CMap是如何多线程协助迁移数据的？？？

/**
 * Moves and/or copies the nodes in each bin to new table. See
 * above for explanation.
 */
private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
    int n = tab.length, stride;
    // 将 length / 8 然后除以 CPU核心数。如果得到的结果小于 16，那么就使用 16。
    // 如果桶较少的话，默认一个 CPU（一个线程）处理 16 个桶
    if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
        stride = MIN_TRANSFER_STRIDE; // 最小16
    
    if (nextTab == null) {            // 新的 table 尚未初始化
        try {
            // 扩容  2 倍
            Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
            // 赋值给新table
            nextTab = nt;
        } catch (Throwable ex) {     
            sizeCtl = Integer.MAX_VALUE;
            return;
        }
        // 更新成员变量
        nextTable = nextTab;
        // transferIndex表示没迁移的桶里最大索引的值，这个会被多个线程瓜分走越来越小。
        // 一开始这个值是旧tab的尾部：也就是 n
        // 瓜分时，从大索引往后分，也就是顺序是 ：  15  14  13 12 ....0
        transferIndex = n; // tag_0
    }
    // 新 tab 的 length
    int nextn = nextTab.length;
    // 创建一个 fwd 节点，用于标记。
  	// 注意，它里面的hash属性是固定的MOVED，还记得 putVal里的helpTransfer前的判断吗？
  	// 当别的线程put的时候，正好发现这个槽位中是 fwd 类型的节点，也调helperTransfer参与进来。
    ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
    boolean advance = true; //临时变量，表示要不要移动槽
    boolean finishing = false; //临时变量，表示当前槽有没有迁移完
    
    for (int i = 0, bound = 0;;) {   //每次for遍历一个桶来迁移，也就是旧table里的一个元素
        Node<K,V> f; int fh;
        while (advance) { //这里的while是配合tag_3的cas做自旋，只有它可能会触发多次循环，其他俩都是1次跳出
          //while比较乱：可以打断点进来调试查看每次的经过
          // 第一次for的时候进 tag_3 确定bound和i，也就是给当前线程分配了 bound ~ i 之间的桶
          // 以后每次--i，只要不大于bound，都进 tag_1，也就是啥都不干
          // 最后一次，等于bound的时候，说明分配给当前线程的桶被它for完了，退出
          int nextIndex, nextBound;
          if (--i >= bound || finishing)  // tag_1
            //如果i比bound还大，或者当前i下的链表没移动完，--i推动一格
            advance = false; 
          else if ((nextIndex = transferIndex) <= 0) {  // tag_2  ，注意！这个赋值操作第一次也要发生
            //如果transferIndex <=0 说明已迁移完成，没有桶需要处理了，退出
            i = -1;
            advance = false;
          } 
          else if (U.compareAndSwapInt  // tag_3
                   (this, TRANSFERINDEX, nextIndex,
                    nextBound = (nextIndex > stride ?
                                 nextIndex - stride : 0))) {
            // 第一次for的时候会走进这里，确定当前线程负责的桶的范围，同时cas更新transferIndex
            // 也就是，多个线程第一次都会访问到这里，通过cas来分一部分桶，cas防止并发下重复分配
            // 注意，来这里之前，经过了tag_2的赋值：
            // 所以这里在cas前 nextIndex = transferIndex = 16
            // cas后， transferIndex = nextBound = (nextIndex - stride) = 0
            // 注意，这里不一定是0，只不过旧长度16被一个线程全拿走了，剩下了0个
            // 也就是说，transfer是本次分配后，还剩下的桶里最大的索引，别的线程还会继续分
            bound = nextBound;// 最小下标0（旧数组）
            i = nextIndex - 1;//最大下标15（旧数组）
            advance = false;
          }
        }  // end while
      
      
        // 判断i的范围，不在可移动插槽的索引范围内，说明全部迁移完了！
        if (i < 0 || i >= n || i + n >= nextn) {
            int sc;
          	// 如果完成了扩容
            if (finishing) { 
                nextTable = null;// 释放
                table = nextTab;// 更新 table
                sizeCtl = (n << 1) - (n >>> 1); // 更新阈值
                return;// 结束方法。
            }
          	// 如果没完成，尝试使用cas减少sizeCtl，也就是扩容的线程数，同时更新标记 finishing为true
            if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                    return;
                finishing = advance = true;// 
                i = n; 
            }
        }
      
      
      	//下面才是真正迁移数据的操作！！！
        else if ((f = tabAt(tab, i)) == null) 
          	// 获取老 tab i 下标位置的变量，如果是 null，就使用 fwd 占位。
          	// cas成功，advance为true，下次for里while会做--i移动一个下标
            advance = casTabAt(tab, i, null, fwd);
        else if ((fh = f.hash) == MOVED)// 如果不是 null 且 hash 值是 MOVED。
            advance = true; // 说明别的线程已经处理过了，移动一个下标
        else {
          	// 到这里，说明这个位置有实际值了，且不是占位符，那就需要我们迁数据了。
          	// 对这个节点上锁。防止别的线程 putVal 的时候向链表插入数据
            synchronized (f) {
                // 判断 i 下标处的桶节点是否和 f 相同 ，确保没有被别的线程动过
                if (tabAt(tab, i) == f) {
                    Node<K,V> ln, hn;// 定义 low, height 高位桶，低位桶
                    // 如果 f 的 hash 值大于 0 属于常规hash，开始拆分高低链表
                  	// 参考静态变量：MOVED -1、TREEBIN -2、RESERVED -3、HASH_BITS > 0
                    if (fh >= 0) {
                        // 和老长度进行与运算，由于 Map 的长度都是 2 的次方（16就是10000 这类的数字）
                      	// 那么取与 n 只有 2 种结果，一种是 0，一种是n
                        // 如果是结果是0 ，拆分后，Doug Lea 将其放在低位链表，反之放在高位链表
                      	// 这里和HashMap的算法一样！
                        int runBit = fh & n; //算算头结点是高位还是低位
                        Node<K,V> lastRun = f; 
                      
                        // 遍历这个桶，注意，这地方有个讨巧的操作！
                      	// 和HashMap不同这里不是一上来就移动，而是先打标记
                      	// 往下看 ↓ （可以借助下面的图来同步说明）
                      	// 
                        for (Node<K,V> p = f.next; p != null; p = p.next) {
                            // 沿着链往下走，挨个取与
                            int b = p.hash & n;
                            // 如果和上次循环的值相等，那不动（当然第一次的话就是和头节点比较）
                            if (b != runBit) {
                              	//如果不相等的话，就切换值
                                runBit = b; // 0遍。
                                lastRun = p; // 这个 lastRun 保证后面的节点与自己的取于值相同，避免后面没
                            }
                        }
                      	//思考一下，经过上一轮遍历完，发生了什么？
                      	// runBit 要么是0 要么是1 ， 
                      	// lastRun 指向了最后一次切换的那个节点，它后面再没发生或切换
                      	// 也就意味着，lastRun后面所有的节点和它都具备相同的runBit值
                      	// 想想，可以做什么？？？
                      
                      	// 对！在lastRun处直接切断！带着后面的尾巴，直接当做拆分后的高位，或者低位链表
                      	// 这样就不需要和hashMap一样挨个断开指针，再挨个接一遍到新链，一锅端就行了
                        if (runBit == 0) {// 如果最后的 runBit 是 0 ，直接当低位链表
                            ln = lastRun;
                            hn = null;
                        }
                        else {
                            hn = lastRun; // 如果最后的 runBit 是 1， 直接当高位链表
                            ln = null;
                        }
                      
                      
                      	// 那么lastRun前面剩下的那些呢？
                      	// 再遍历一遍就是了，注意，是从头结点f遍历到lastRun，后面的不需要操心了
                        for (Node<K,V> p = f; p != lastRun; p = p.next) {
                            int ph = p.hash; K pk = p.key; V pv = p.val;
                            if ((ph & n) == 0) // 如果与运算结果是 0，那么放低位链表，注意是头插
                                ln = new Node<K,V>(ph, pk, pv, ln); // 参数里的ln是next，头插！
                            else // 1 则放高位
                                hn = new Node<K,V>(ph, pk, pv, hn);
                        } // 为什么这里不怕多线程时的头插法出问题？（因为在sync里！）
                      
                        // 这里往下就类似 hashMap 
                        // 设置低位链表放在新链表的 i
                        setTabAt(nextTab, i, ln);
                        // 设置高位链表，在原有长度上加 n
                        setTabAt(nextTab, i + n, hn);
                        // 将旧的链表设置成占位符，表示迁移完了！
                        setTabAt(tab, i, fwd);
                        // 继续向后推进
                        advance = true;
                    }
                  	// 如果是红黑树同样的路子，设置高低位node
                    else if (f instanceof TreeBin) {
                        TreeBin<K,V> t = (TreeBin<K,V>)f;
                        TreeNode<K,V> lo = null, loTail = null;
                        TreeNode<K,V> hi = null, hiTail = null;
                        int lc = 0, hc = 0;
                        // 遍历
                        for (Node<K,V> e = t.first; e != null; e = e.next) {
                            int h = e.hash;
                            TreeNode<K,V> p = new TreeNode<K,V>
                                (h, e.key, e.val, null, null);
                            // 和链表相同的判断，与运算 == 0 的放在低位
                            if ((h & n) == 0) {
                                if ((p.prev = loTail) == null)
                                    lo = p;
                                else
                                    loTail.next = p;
                                loTail = p;
                                ++lc;
                            } // 不是 0 的放在高位
                            else {
                                if ((p.prev = hiTail) == null)
                                    hi = p;
                                else
                                    hiTail.next = p;
                                hiTail = p;
                                ++hc;
                            }
                        }
                        // 如果树的节点数小于等于 6，那么转成链表，反之，创建一个新的树
                        ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                            (hc != 0) ? new TreeBin<K,V>(lo) : t;
                        hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                            (lc != 0) ? new TreeBin<K,V>(hi) : t;
                        // 低位树
                        setTabAt(nextTab, i, ln);
                        // 高位树
                        setTabAt(nextTab, i + n, hn);
                        // 旧的设置成占位符
                        setTabAt(tab, i, fwd);
                        // 继续向后推进
                        advance = true;
                    }
                }
            }
        }
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215

总结

1、关于多线程协同

原来：128，扩容后256

难道使用单线程去完成所有数据的迁移工作？

file

既然使用多线程进行迁移，如果保证数据不能乱？

将数组分段（桶），每个线程负责至少16个桶（stride），8个线程就可以并行工作了

至于谁分哪些桶，从高索引到低索引，通过cas一起减transferIndex的值来实现，避免重复切分

切一段，低索引叫bound，高索引叫i，遍历迁移就是了

2、关于数据迁移（一个讨巧的小操作）

file

tips：

第一次，从11往后遍历，最后 runBit=0， lastRun指向31节点

从31处切断，后面的一窝端直接当低位链表，不需要再挨个动他们

第二次，再遍历11 - 30 ，根据情况头插到高位和低位新链表上

3、线程安全性

1、多个线程通过cas操作防止重复操作。

2、节点引用的地方使用volatile保持了线程修改时对其他线程及时可见

3、迁移的时候对插槽加sync锁，保障安全性

2.3.5 get方法

**目标：**1、ConcurrentHashMap查询是否加锁，如何保证线程安全

2、在查询的时候遇到扩容怎么办

ConcurrentHashMap查询流程图如下

tips

多线程下，所谓get的不安全因素，就是最怕读到脏数据

get的时候取到了数据，其实其他线程已经把它改掉了，就是所谓的可见性问题。

file
get方法源码如下

//get操作无锁
//因为Node的val和next是用volatile修饰的
//多线程环境下线程A修改结点的val或者新增节点的时候是对线程B可见的
public V get(Object key) {
    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
    //key取hash
    int h = spread(key.hashCode());
  	//1.判断table是不是空的，2.当前桶上是不是空的
  	//如果为空，返回null
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
      	//找到对应hash槽的第一个node，如果key相等，返回value
        if ((eh = e.hash) == h) {
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                return e.val;
        }
        
        else if (eh < 0) 
          //hash值为负值表示正在扩容，这个时候查的是ForwardingNode的find方法来定位到nextTable新表中
          return (p = e.find(h, key)) != null ? p.val : null;
      
        while ((e = e.next) != null) { //既不是首节点也不是ForwardingNode，那就往下遍历
          if (e.hash == h &&
              ((ek = e.key) == key || (ek != null && key.equals(ek))))
            return e.val;
        }
    }
    //遍历完还没找到，返回null
    return null;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

思考：

get没有加锁，在进行查询的时候是如何保证读取不到脏数据呢？

猜想一下？

是在内部类Node类的val上加了volatile？

file
2、是在成员变量数组table上加了volatile？

file

结论：get通过Node内部类volatile关键字来保证可见性、有序性

总结

计算hash值，定位到该table索引位置，如果是首节点符合就返回
如果遇到扩容的时候，会调用标志正在扩容节点ForwardingNode的find方法，查找该节点，匹配就返回
以上都不符合的话，就往下遍历节点，匹配就返回，否则最后就返回null
get不加锁，是因为Node的成员val和指针next是用volatile修饰的
在1.8中ConcurrentHashMap的get操作全程不需要加锁，这也是它比其他并发集合比如hashtable安全效率高的原因之一

扩展：

remove的操作与put一样。只是put是加到链表上，而remove是在链表上移除。

题外话

Cmap里用到了大量的CAS

CAS（Compare and Swap）, 比较并交换，它是一个乐观锁

比较的什么？替换的什么？

比较当前工作内存的值和主内存的值，如相同则修改，否则继续比较；直到内存和工作内存中的值一致为止

file

解释

这是因为我们执行第一个的时候，期望值（主存）和原本值是满足的，因此修改成功，

第二次后，主内存的值已经修改成了B，不满足期望值，因此返回了false，本次写入失败

cas有什么缺点？如何解决

缺点一

缺点：

最大缺点就是ABA问题

ABA:如果一个值原来是A，变成了B，又变成了A，那么使用CAS进行检查时会发现它的值没有发生变化，但是实际上却变化了



解决方案：

1、使用版本号。在变量前面追加上版本号，每次变量更新的时候把版本号加一，那么A－B－A 就会变成1A-2B－3A

2、从Java1.5开始JDK的atomic包里提供了一个类AtomicStampedReference来解决ABA问题

这个类的compareAndSet方法作用是首先检查当前引用是否等于预期引用，并且当前标志是否等于预期标志，如果全部相等，则更新
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

缺点二

不停自旋（循环）会给CPU带来更大的开销 
1

专注Java技术干货分享，欢迎志同道合的小伙伴，一起交流学习

相关阅读:
小学生写作业用什么灯最好？分享学生专用的暖光LED灯
 flutter系列之:widgets,构成flutter的基石
 win10声音图标有个❌没有声音
 docker下载并进入PostgreSql命令行模式
 解密数仓高可用failover流程
 光环效应——谁说头上有光的就算英雄
 双非二本程序员，年近30，5年间在大厂中横跳，工资翻了三番
 springmvc异常处理解析#ExceptionHandlerExceptionResolver
Debezium系列之：Kafka Connect配置参数总结
 机器学习（五）逻辑回归
原文地址：https://blog.csdn.net/bxg_kyjgs/article/details/126265405