ArrayList集合源码分析

文章目录

ArrayList集合源码分析
一、字段分析
二、构造方法分析
三、方法分析
四、总结

在这里插入图片描述

内容如有错误或者其他需要注意的知识点，欢迎指正或者探讨补充，共同进步。

一、字段分析

//默认初始化容量。这里和Vector一样，只是Vector,没有用一个变量，而是调用无参构造函数时，直接塞了个10。
private static final int DEFAULT_CAPACITY = 10;
//这里给出了两个空数组。有两个疑问，1.为什么给空数组2.为什么还给了两个
//1。在我们创建空的ArrayList集合时，为了避免创建多个空的数组，而换成统一用这里的口空数组代替，达到了节约内存和提高效率。
//2。为了区分我们在构造集合时，是用的有参构造函数，还是无参函数。不同的构造也会带来扩容机制的不同。
//	-	无参构造函数，会使用DEFAULTCAPACITY_EMPTY_ELEMENTDATA 数组，在第一次添加元素是，扩容后的容量是10。
//	-	有参构造函数，如果传入的是0，则是用EMPTY_ELEMENTDATA ，扩容是1.5的扩容。0->1->2->3->4->6->9->13，如果数据很少
//		少到比10还小，能够降低内存消耗的。
//所以又有了疑问，那为什么不用一个就可以了呢，第一次扩容都用容量10。
//	-	源码上面的注释是：Shared empty array instance used for default sized empty instances. 
//		We distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when first element is added.
//		这是用于默认大小的空实例的共享空数组实例。我们将其与EMPTY_ELEMENTDATA区分开来，以便在添加第一个元素时知道要扩充多少空间。
//		同时如果有那种添加很少元素的需求，元素数量小于10，这样做是可以减少内存消耗的，达到更适配相应需求的目的。
private static final Object[] EMPTY_ELEMENTDATA = {};
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

//用来存储数据的数组
transient Object[] elementData;

//实际存储了数据的个数
private int size;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

二、构造方法分析

从构造方法可以看出，我们在创建 ArrayList 时，如果容量为0，则给个空数组。

public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
        	//如果初始容量为0，则空数组代替，size = 0
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }


public ArrayList() {
		//如果没有指定容量，则用默认的空数组代替
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }


public ArrayList(Collection<? extends E> c) {
		//toArray()通常会将泛型擦除掉，比如应该是List 会变成 Objects[];
		//为何这样做呢？即便你不擦除掉，在代码编译时也会将泛型擦除掉，所以为了提高效率，加快编译速度。
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            //这里为什么要加这样的判断呢？因为通常来说c.toArray();已经返回了Object[],但如果这个是个人实现的
            //比如里面调用了c.toArray(Integer[]);则会返回Integer[],所以这里额外判断下
            //为了确保elementData 为Object数组，如果使用系统提供的toArray()方法，会返回
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

三、方法分析

添加元素方法，是非线程安全的方法。并且在添加元素的时候会校验是否需要扩容。

//向已有元素的末尾添加元素
public boolean add(E e) {
		//判断是否需要扩容，所需容量最少为：已有元素数量 + 1
		//但里面其实会判断，存储数据的数据是否为空，空则需最小容量为 DEFAULT_CAPACITY 
		//否则取Math.max（已有元素数量 + 1，DEFAULT_CAPACITY ），可向下看
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //已有元素的末尾添加上新元素
        elementData[size++] = e;
        //添加成功
        return true;
    }

private void ensureCapacityInternal(int minCapacity) {
		//判断扩容之前，判断所需的最小容量，而calculateCapacity(elementData, minCapacity) 就是判断
		//所需的容量，然后拿这个所需的最少容量去判断是否需要扩容。
        ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
    }

private static int calculateCapacity(Object[] elementData, int minCapacity) {
		//正如上面所说的，如果数组为空，则所需取其中较大值，这不难理解
		//这里也是第一次扩容采用什么决策作出了判断，如果是调用无参构造函数，第一次扩容是10。
		//如果是有参，且参数0，则1.5倍扩容，具体原因，上面参数介绍时详细说了。
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            return Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        return minCapacity;
    }
//这时候我们拿到了我们所需要的最小容量，来判断是否需要扩容了
private void ensureExplicitCapacity(int minCapacity) {
		//从Vector源码中我们之前到，这个是继承自Abastrack，用来记录版本号，防止迭代过程中集合被修改了，因为迭代器创建时，
		//会保存创建那一时刻集合的版本号，迭代的过程的会比较自己保存的版本号和集合的版本号，从而判断跌倒过程中是否被修改。
		//这里的作用是一样的。
        modCount++;

        // overflow-conscious code
        //如果我们所需要的最小容量比elementData数组长度还大，那必须要扩容了，不然要下标越界了。
        //如果是我们第一次添加元素，从构造函数可以，elementData是个空数组，这里也会扩容。 10 - 0 > 0
        // ！！！从这里可以看出，在添加元素时，如果元素数量大于数组长度 才会触发扩容，就是数组已经被塞满了，不是说达到数组
        //容量的百分之多少。
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

//到这里就是确定要扩容了，并且我们拿到了所需的最小容量，用来判断该如何扩容
private void grow(int minCapacity) {
        // overflow-conscious code
        //记录当前数组长度
        int oldCapacity = elementData.length;
        //记录扩容后的数组长度，先按1.5倍来扩容
        //oldCapacity >> 1 相当于 oldCapacity / 2
        //那自己的一般 + 自己，不就是自己原来的1.5倍。
        //至于最后是否会用这个值了，还需后面判断。
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        //如果扩容后的容量还是不够，则先用所需的最小容量最为新容量的值。
        //你可能会疑问，我们添加元素都是一个一个添加的，按理说不可能扩容后容量还达不到需要的呀。
        //然后确实可能达不到，如果使用的有参构造函数，且参数为0，那么第一次添加元素，这里传入的值就是1，
        //但是初始容量为0，1.5扩容后还是0，显然不够的，这是后就会扩容成容量为1的数组。其实第二次添加元素，
        //扩容还是会不够，注意我说的是开始调用有参构造函数且参数0，因为无参构造，第一次扩容为10，这里不会触发。
        //还有一个可能是newCapacity 溢出了变成负数。则 新容量就是 minCapacity 了，即数组扩容到length + 1；
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
            //如果新容量值要溢出了，注意是快要溢出，MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
        	//这时候我们继续确定新容量到底该多少
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        //到这里新容量就去确定好了，去做扩容啦。
        //这个方法会创建一个新的数组，将旧的数组按索引依次赋值到新数组上，未填充到的为数据类型的默认值，
        //如 int 为0，Object 为 null.
        //同时这是消耗新能的操作，涉及到新数组的创建和所有元素的赋值。
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
//和 Vecotor.class 源码一样的，如果快要溢出了，则直接给所能给的容量的极限。
private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

//向指定索引位置添加元素
public void add(int index, E element) {
        rangeCheckForAdd(index);
		//判断是否需要扩容，上面分析过了
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //上面已经进行过扩容动作了，这段代码看起来好像没必要。
        //上面看见的Arrays.copyOf 其实底层最终调用就是这个方法，达到扩容的目的。
        //难道这也是扩容？？此不是多此一举
        //首先依次介绍下这个方法参数含义
        //src：源数组，要将其内容复制到目标数组中。
		//srcPos：源数组中开始复制的位置。
		//dest：目标数组，源数组的内容将复制到该数组中。
		//destPos：目标数组中开始复制的位置。
		//length：要复制的元素个数。
		//知道了含义就很好理解了，是把将要插入的位置，把该位置以及之后的所有元素往后移动一格。。。
		//从这里也可看出，ArrayList 向指定下标插入元素效率低下，时间复杂度O(n),并且并不是覆盖掉
		//该位置原先的元素，而是统统靠后移。
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        //好了，这个位置被腾出位置了，可以插了。
        elementData[index] = element;
        size++;
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104

获取元素方法：这个方法没啥好说的。

//根据索引获取元素
public E get(int index) {
		//检查索引是否越界
        rangeCheck(index);
		//返回该位置值
        return elementData(index);
    }
//检查索引是否越界
private void rangeCheck(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }
//返回index索引位置的值
E elementData(int index) {
        return (E) elementData[index];
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

扩容方法：介绍添加元素方法时说过了。
移除元素方法：可以根据下标位置移除元素，也可根据元素值移除元素。和Vector源码很相似

//根据索引位置删除元素(可以发现，这里和Vector 的源码一模一样)
public E remove(int index) {
		//检查索引是否越界
        rangeCheck(index);
		//版本号+1
        modCount++;
        //得到该索引位置的值
        E oldValue = elementData(index);
		//需要移动的元素数量，就是你讲index位置的元素删了，那这个元素后院的所有的元素都要前移，这个值就是需要
		//移动的元素数量即index后面元素的数量
        int numMoved = size - index - 1;
        //判断index后面是否有值
        if (numMoved > 0)
        	//将要移动的元素前移，其实是吧那个要删除的元素覆盖了从而达到了删除元素的目的。
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        //为什么要删除末尾元素呢，因为如果index 是最后以为元素，那么就不会触发元素前移，所以这里
        //多一步，将末尾元素设置为null，就是为了处理这一特殊情况。所以如果index 后面有值，这一步是
        //多余的，末尾已经是null了。                     
        elementData[--size] = null; // clear to let GC do its work
		//返回被删除的元素元素值
        return oldValue;
    }

//根据元素值删除元素
public boolean remove(Object o) {
		//从这里也可看出,ArrayList是允许删除null元素值的，同时有相同值元素是，删除的是最靠前的那个。
		//我们在分析Vector删除源码时，在获取o的下标位置时，会调用indexOf方法，和这里的判断是一样的。
		//同时有个疑问？这个难道不可以统一写成elementData[index].equals(o)不就行了吗，就可以处理o是null或不是null的情况，
		//且不会报错,且能达到相同效果，那这个判断不是冗余了嘛。你在说什么胡话？刚刚才说的ArrayList是允许添加null的，如果
		//遍历获取到的元素如果是null那不就是报错了吗？所以这里这样写，才可以避免传入的o是null，同时遍历获取到的
		//值也是null，从而判断报错的情况。
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }

//和上面根据索引删除元素逻辑一样的，从这里可以看出，代码冗余了(*￣︶￣)
private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57

迭代器设计：和Vector的一样，提供了两种的迭代器。Itr 和 ListItr。
- 不同的是，ArrayList 的迭代器在迭代过程中是不上锁的，但是Vector上锁，所以是线程不安全的。
- 相同是的都有版本号坚持机制，Itr迭代过程中不允许集合修改，而Listitr 允许修改。


//这里和Vector几乎相同，这里只标注不同的地方。
private class Itr implements Iterator<E> {
        int cursor;       // index of next element to return
        int lastRet = -1; // index of last element returned; -1 if no such
        int expectedModCount = modCount;

        Itr() {}

        public boolean hasNext() {
            return cursor != size;
        }

        @SuppressWarnings("unchecked")
        public E next() {
        	//和Vector 不同的是这里Vector会上锁，保证线程安全。
            checkForComodification();
            int i = cursor;
            if (i >= size)
                throw new NoSuchElementException();
            //这里和Vector不太一样。Vector 是没有这个判断的，感觉有个疑问，上面都判断了 i >= size 了，
            //那么能到这里 i 肯定 < size 了， 而size是实际存储数据的个数，即便数组塞满了，那也是 size = length，
            //怎么可能   i < size 却 i >= length，所以感觉这里判断多此一举了。
            //要知道，ArrayLIst是非线程安全的，你在迭代的过程中，是可能有并发操作，修改了容量了，而这里做了这样的判断
            //就是防止并发操作下，做下检查。
            //而这种机制就是fail_fast(快速失败，敲黑板)。这里也是做了双重检查，checkForComodification也是检查是否被修改
            //这里拿到 elementData 之后再次检查，尽量避免迭代过程中集合被修改。而Vector是加了锁的，锁的还是class对象
            //所以检查一次即可。
            //这里双重检查就可避免非线程安全问题了吗，但是不是，比如
            Object[] elementData = ArrayList.this.elementData;
            if (i >= elementData.length)
                throw new ConcurrentModificationException();
            //---------------------------------------------------    
            //比如你两次都检查过后，到了这里发生了修改，还是还会带来问题，不过概率降低了。
            cursor = i + 1;
            return (E) elementData[lastRet = i];
        }

		//这里逻辑 和 Vecotr的迭代器一样的，唯一区别少了把锁
        public void remove() {
            if (lastRet < 0)
                throw new IllegalStateException();
            checkForComodification();

            try {
                ArrayList.this.remove(lastRet);
                cursor = lastRet;
                lastRet = -1;
                expectedModCount = modCount;
            } catch (IndexOutOfBoundsException ex) {
                throw new ConcurrentModificationException();
            }
        }

        @Override
        @SuppressWarnings("unchecked")
        public void forEachRemaining(Consumer<? super E> consumer) {
            Objects.requireNonNull(consumer);
            final int size = ArrayList.this.size;
            int i = cursor;
            if (i >= size) {
                return;
            }
            final Object[] elementData = ArrayList.this.elementData;
            if (i >= elementData.length) {
                throw new ConcurrentModificationException();
            }
            while (i != size && modCount == expectedModCount) {
                consumer.accept((E) elementData[i++]);
            }
            // update once at end of iteration to reduce heap write traffic
            cursor = i;
            lastRet = i - 1;
            checkForComodification();
        }
		//检查版本是否发生变化
        final void checkForComodification() {
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
        }
    }


private class ListItr extends Itr implements ListIterator<E> {
        ListItr(int index) {
            super();
            cursor = index;
        }

        public boolean hasPrevious() {
            return cursor != 0;
        }

        public int nextIndex() {
            return cursor;
        }

        public int previousIndex() {
            return cursor - 1;
        }

        @SuppressWarnings("unchecked")
        public E previous() {
            checkForComodification();
            int i = cursor - 1;
            if (i < 0)
                throw new NoSuchElementException();
            Object[] elementData = ArrayList.this.elementData;
            //这里同样多了此检查结构是否变化
            if (i >= elementData.length)
                throw new ConcurrentModificationException();
            cursor = i;
            return (E) elementData[lastRet = i];
        }
		//和Vector比少了把锁，逻辑一样的
        public void set(E e) {
            if (lastRet < 0)
                throw new IllegalStateException();
            checkForComodification();

            try {
                ArrayList.this.set(lastRet, e);
            } catch (IndexOutOfBoundsException ex) {
                throw new ConcurrentModificationException();
            }
        }
		//这个也是一样的，同样少了把锁。
        public void add(E e) {
            checkForComodification();

            try {
                int i = cursor;
                ArrayList.this.add(i, e);
                cursor = i + 1;
                lastRet = -1;
                expectedModCount = modCount;
            } catch (IndexOutOfBoundsException ex) {
                throw new ConcurrentModificationException();
            }
        }
    }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141

四、总结

ArraList 底层使用数组存储结构，删除或添加元素的效率时间复杂度O（n），效率低下。查找元素快 O（1）。
是线程不安全的数据结构，并发场景下可能带来非线程安全的问题。
扩容是按1.5来进行扩容，当然不是绝对的，比如第一次添加元素时，会判断调用的是那种构造函数，无参第一次扩容为10，有参且为0，扩容后为1。还有就是快要溢出的情况，当需要的容量 > MAX_ARRAY_SIZE,则新容量为Integer.MAA_VALUE。

相关阅读:
Spring事务不生效的场景的解决方案
 基于Vue和Spring Boot的在线点餐系统设计与实现
 基于Rook+Ceph的云原生存储架构剖析
 【最新版】ChatGPT/GPT4科研应用与AI绘图论文写作（最新增加Claude3、Gemini、Sora、GPTs技术及AI领域中的集中大模型的最新技术）
java计算机毕业设计学生勤工助学管理系统源程序+mysql+系统+lw文档+远程调试
 脉冲神经网络原理及应用,脉冲神经网络怎么训练
 2.继承总结方法
 python小玩意——计算器
 STM32H750启动和内存优化（分散加载修改）
【SpringCloud-学习笔记】DockerCompose
原文地址：https://blog.csdn.net/weixin_45278293/article/details/136417686