• J2EE从入门到入土02.List集合解析


    目录

    ArrayList分析

    属性 

    常用方法 

    构造函数 

    增加 

    刪除 

      修改

     总结

    ArrayList关于删除需要注意的点位 

    LinkedList 解析

     Vector解析

     CopyOnWriteArrayList解析

    可以从源码看出 List 接口 继承  Collection<E>

    在Collection中,List集合是有序的,且可重复的可对其中每个元素的插入位置进行精确地控制,可以通过下标,foreach,迭代器来遍历

    List有那么几个类ArrayList、LinkedList、Vector、CopyOnWriteArrayList

    ArrayList分析

    ArrayList 是一个数组队列,相当于 动态数组。与Java中的数组相比,它的容量能动态增长。它继承于AbstractList,实现了List, RandomAccess, Cloneable, java.io.Serializable这些接口。

     

    • AbstractList 抽象类,提供了List接口的相关实现和迭代逻辑的实现,不过对ArrayList意义不大,因为ArrayList大量重写了AbstractList的实现
    • List 接口,定义了数组的增删改查迭代遍历等相关操作。
    • Cloneable 接口,支持ArrayList克隆
    • Serializabel 接口,支持ArrayList序列化与反序列化
    • RandomAccess 接口,支持ArrayList快速访问

    属性 

    可通过源码获取属性

    1. public class ArrayList<E> extends AbstractList<E>
    2. implements List<E>, RandomAccess, Cloneable, java.io.Serializable
    3. {
    4. // 默认初始容量。
    5. private static final int DEFAULT_CAPACITY = 10;
    6. // 用于空实例的共享空数组(创建空实例时使用)
    7. private static final Object[] EMPTY_ELEMENTDATA = {};
    8. // 用于默认大小的空实例的共享空数组实例。
    9. // 我们将其与EMPTY_ELEMENTDATA区分开来,以便知道添加第一个元素时要膨胀多少。
    10. private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
    11. // 存储数组列表元素的数组缓冲区。arrayList的容量就是这个数组缓冲区的长度。
    12. // 任何空的ArrayList 将被扩展到10当(第一次添加元素时)
    13. // 注意是通过transient修饰
    14. transient Object[] elementData; // non-private to simplify nested class access
    15. // 数组列表的大小(它包含的元素数量)
    16. private int size;
    17. /* 要分配的数组的最大大小
    18. * 尝试分配更大的数组可能会导致OutOfMemoryError:请求的数组大小超过VM限制*/
    19. private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
    20. // 该属性是通过继承 AbstractList 得来,列表修改的次数(版本号)
    21. protected transient int modCount = 0;
    22. }

    通过源码我们可以知道到:

    • DEFAULT_CAPACITY 表示ArrayList的初始容量(采用无参构造时第一次添加元素扩容的容量,后面会介绍),默认是10
    • elementData 表示ArrayList实际储存数据的数组,是一个Object[]
    • size 表示该ArrayList的大小(就是elementData包含的元素个数)。
    • MAX_ARRAY_SIZE 表示ArrayList能分配的最大容量 Integer.MAX_VALUE - 8
    • modCount 表示该ArrayList修改的次数,在迭代时可以判断ArrayList是否被修改。

    这里可以看出ArrayList底层实现就是一个数组,其初始容量是10 

    常用方法 

    构造函数 

    1. // 使用指定的初始容量构造一个空列表。
    2. public ArrayList(int initialCapacity) {
    3. if (initialCapacity > 0) {
    4. this.elementData = new Object[initialCapacity];
    5. } else if (initialCapacity == 0) {
    6. this.elementData = EMPTY_ELEMENTDATA; // 如果为0使用默认空数组
    7. } else {
    8. throw new IllegalArgumentException("Illegal Capacity: "+initialCapacity);
    9. }
    10. }
    11. /*Constructs an empty list with an initial capacity of ten.
    12. * 构造一个初始容量为10的空列表。(在第一次扩容时容量才为10,现在还是null)*/
    13. public ArrayList() {
    14. this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    15. }
    16. // 构造一个包含指定集合的元素的列表,按照集合的迭代器返回它们的顺序。
    17. public ArrayList(Collection<? extends E> c) {
    18. elementData = c.toArray(); // 将集合转变为数组
    19. // 赋值 size 并判非 0
    20. if ((size = elementData.length) != 0) {
    21. // c.toArray might (incorrectly) not return Object[] (see 6260652) 这是一个bug在java9已经被解决
    22. if (elementData.getClass() != Object[].class)
    23. elementData = Arrays.copyOf(elementData, size, Object[].class);
    24. } else {
    25. // replace with empty array.
    26. this.elementData = EMPTY_ELEMENTDATA;
    27. }
    28. }

    通过查看源码我们可以发现:

    • ArrayList 有三个构造函数:指定初始化大小构造,无参构造,指定初始化数据构造
    • ArrayList的无参构造,其实默认是空数组,我们上面说的初始化容量默认为10,是当我们用无参构造函数后,第一次向ArrayList添加元素时扩容的默认大小。

    增加 

    ArrayList添加元素的方法有四个:一个是在末尾添加,一个是指定索引添加,另两个是在末尾添加集合和在指导索引位置添加集合 

    1. // 将指定的元素添加到列表的末尾。
    2. public boolean add(E e) {
    3. // 确保容量足够
    4. ensureCapacityInternal(size + 1); // Increments modCount!!
    5. elementData[size++] = e;
    6. return true;
    7. }
    8. // 在列表指定的位置插入指定的元素。
    9. // 将当前位于该位置的元素(如果有的话)和随后的元素向右移动(下标加1)。
    10. public void add(int index, E element) {
    11. // 确保索引合法
    12. rangeCheckForAdd(index);
    13. // 确保容量
    14. ensureCapacityInternal(size + 1); // Increments modCount!!
    15. // 移动元素 (原始数组,起始位置,目标数组,起始位置,拷贝大小)
    16. System.arraycopy(elementData, index, elementData, index + 1, size - index);
    17. elementData[index] = element;
    18. size++; // 大小加 1
    19. }
    20. private void ensureCapacityInternal(int minCapacity) {
    21. // 判断是不是通过无参构造创建的
    22. if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
    23. // 这才是第一次添加元素是默认扩容到10
    24. minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    25. }
    26. ensureExplicitCapacity(minCapacity);
    27. }
    28. // 预扩容
    29. private void ensureExplicitCapacity(int minCapacity) {
    30. modCount++; // 修改版本号
    31. // overflow-conscious code
    32. if (minCapacity - elementData.length > 0)
    33. grow(minCapacity);
    34. }
    35. // 增加容量,以确保至少可以保存由最小容量(minCapacity)参数指定的元素数量。
    36. private void grow(int minCapacity) {
    37. // overflow-conscious code
    38. int oldCapacity = elementData.length;
    39. // 1.5倍扩容
    40. int newCapacity = oldCapacity + (oldCapacity >> 1);
    41. if (newCapacity - minCapacity < 0) // 扩容后不满足期望大小则以期望大小作为容量
    42. newCapacity = minCapacity;
    43. if (newCapacity - MAX_ARRAY_SIZE > 0) // 分配jvm的最大容量,防溢出
    44. newCapacity = hugeCapacity(minCapacity);
    45. // minCapacity is usually close to size, so this is a win:
    46. // 扩容
    47. elementData = Arrays.copyOf(elementData, newCapacity);
    48. }
    49. // 分配最大容量
    50. private static int hugeCapacity(int minCapacity) {
    51. if (minCapacity < 0) // overflow
    52. throw new OutOfMemoryError();
    53. return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE;
    54. }
    55. // 将指定集合中的所有元素追加到此列表的末尾。按照指定集合的迭代器返回它们的顺序。
    56. public boolean addAll(Collection<? extends E> c) {
    57. Object[] a = c.toArray(); // 集合转数组
    58. int numNew = a.length; // 获取要添加的长度
    59. ensureCapacityInternal(size + numNew); // Increments modCount
    60. System.arraycopy(a, 0, elementData, size, numNew); // 通过元素拷贝来追加元素
    61. size += numNew;
    62. return numNew != 0;
    63. }
    64. // 将指定集合中的所有元素插入到此列表中,从指定位置开始。
    65. // 新元素将按照指定集合的迭代器返回的顺序出现在列表中。
    66. public boolean addAll(int index, Collection<? extends E> c) {
    67. rangeCheckForAdd(index); // 检查索引是否合法
    68. Object[] a = c.toArray();
    69. int numNew = a.length;
    70. ensureCapacityInternal(size + numNew); // Increments modCount
    71. int numMoved = size - index;
    72. if (numMoved > 0) // 腾出空位
    73. System.arraycopy(elementData, index, elementData, index + numNew,numMoved);
    74. // 将a拷贝到elementData
    75. System.arraycopy(a, 0, elementData, index, numNew);
    76. size += numNew;
    77. return numNew != 0;
    78. }

     

    通过源码我们需要注意:

    • 扩容是原容量+原容量大小一半,也就是说是按照1.5倍扩容:oldCapacity + (oldCapacity >> 1),但最后的容量并不一定是按照这个规则计算得到的大小,因为他还有两个if判断。
    • ArrayList中数组最大只能分配Integer.MAX_VALUE,在大就会导致OutOfMemoryError
    • ArrayList扩容时有许多溢出判断操作,这非常值得借鉴。
    • ArrayList扩容底层调用的是System.arraycopy(Object src,int srcPos,Object dest, int destPos,in

    数组容量会改变,改变的规则是按照原数组1.5倍进行扩容,但最终容量不一定是通过该规则计算得到的值,因为后面有两个if判断:1.是否满足期望容量;2.是否超出jvm分配的最大容量 

    刪除 

    1. // 删除列表中指定位置的元素。将所有后续元素向左移动(从它们的下标减去1)。
    2. public E remove(int index) {
    3. // 确保index合法
    4. rangeCheck(index);
    5. modCount++;
    6. E oldValue = elementData(index); // 获取老元素
    7. int numMoved = size - index - 1;
    8. // 判断是否需要移动
    9. if (numMoved > 0)
    10. System.arraycopy(elementData, index+1, elementData, index,numMoved);
    11. elementData[--size] = null; // clear to let GC do its work
    12. return oldValue;
    13. }
    14. // 从列表中删除指定元素的第一个匹配项,如果它存在的话并返回 true。
    15. public boolean remove(Object o) {
    16. if (o == null) { // 空值单独删除,因为add时也没有对null进行效验
    17. for (int index = 0; index < size; index++)
    18. if (elementData[index] == null) {
    19. fastRemove(index); // 移除元素
    20. return true;
    21. }
    22. } else {
    23. for (int index = 0; index < size; index++)
    24. if (o.equals(elementData[index])) { // 通过equals比较,如果是自定义对象元素,一定要重写它
    25. fastRemove(index);
    26. return true;
    27. }
    28. }
    29. return false;
    30. }
    31. // 跳过边界检查的移除方法(因为已经被验证边界合法)
    32. private void fastRemove(int index) {
    33. modCount++;
    34. int numMoved = size - index - 1;
    35. if (numMoved > 0) // 通过数组拷贝覆盖来移除元素
    36. System.arraycopy(elementData, index+1, elementData, index,numMoved);
    37. elementData[--size] = null; // clear to let GC do its work
    38. }
    39. // 从此列表中删除指定集合中包含的所有元素。
    40. // 如果此列表包含空元素,而指定的集合不允许空元素则会抛出NullPointerException
    41. public boolean removeAll(Collection<?> c) {
    42. // 判断是否为null
    43. Objects.requireNonNull(c);
    44. return batchRemove(c, false);
    45. }
    46. // 通过不同complement来操作列表
    47. private boolean batchRemove(Collection<?> c, boolean complement) {
    48. final Object[] elementData = this.elementData;
    49. int r = 0, w = 0;
    50. boolean modified = false;
    51. try {
    52. for (; r < size; r++) // complement决定操作行为
    53. if (c.contains(elementData[r]) == complement)
    54. elementData[w++] = elementData[r];
    55. } finally {
    56. // Preserve behavioral compatibility with AbstractCollection,
    57. // even if c.contains() throws.
    58. if (r != size) {
    59. System.arraycopy(elementData, r,elementData, w,size - r);
    60. w += size - r;
    61. }
    62. if (w != size) { // 将删除的元素赋null
    63. // clear to let GC do its work
    64. for (int i = w; i < size; i++)
    65. elementData[i] = null;
    66. modCount += size - w;
    67. size = w;
    68. modified = true;
    69. }
    70. }
    71. return modified;
    72. }
    73. @Override
    74. public boolean removeIf(Predicate<? super E> filter) {
    75. Objects.requireNonNull(filter);
    76. // figure out which elements are to be removed 找出要删除的元素
    77. // any exception thrown from the filter predicate at this stage
    78. // will leave the collection unmodified
    79. int removeCount = 0;
    80. final BitSet removeSet = new BitSet(size); // 记录要删除元素的集合
    81. final int expectedModCount = modCount; // 记录版本号
    82. final int size = this.size;
    83. for (int i=0; modCount == expectedModCount && i < size; i++) {
    84. @SuppressWarnings("unchecked")
    85. final E element = (E) elementData[i];
    86. if (filter.test(element)) { // 记录要删除的元素index
    87. removeSet.set(i);
    88. removeCount++;
    89. }
    90. }
    91. if (modCount != expectedModCount) { // 如果版本号不一致,抛出异常
    92. throw new ConcurrentModificationException();
    93. }
    94. // shift surviving elements left over the spaces left by removed elements
    95. final boolean anyToRemove = removeCount > 0;
    96. if (anyToRemove) {
    97. final int newSize = size - removeCount;
    98. // 遍历并剔除要删除的元素
    99. for (int i=0, j=0; (i < size) && (j < newSize); i++, j++) {
    100. i = removeSet.nextClearBit(i);
    101. elementData[j] = elementData[i];
    102. }
    103. for (int k=newSize; k < size; k++) {
    104. elementData[k] = null; // Let gc do its work
    105. }
    106. this.size = newSize;
    107. if (modCount != expectedModCount) {
    108. throw new ConcurrentModificationException();
    109. }
    110. modCount++;
    111. }
    112. return anyToRemove;
    113. }

    通过源码我们可以知道:

    • ArrayList删除元素是通过System.arraycopy移动数组覆盖元素来实现的
    • ArrayList添加元素时没有校验null值,所以删除null值时是特殊处理的
    • ArrayList通过对象删除时判断相等是通过equals判断,所以我们在储存自定义对象是要注意对equals进行重写

      修改

    1. // 将列表中指定位置的元素替换为指定的元素。
    2. public E set(int index, E element) {
    3. rangeCheck(index);
    4. E oldValue = elementData(index);
    5. elementData[index] = element;
    6. // 返回被替换的元素
    7. return oldValue;
    8. }

     总结

    简单数据结构,超出容量自动扩容,动态数组
    内部实现是基于基础的对象数组的
    随机访问快
    不适合随机增加或删除
    线程不安全

    ArrayList关于删除需要注意的点位 

    ArrayList remove 的注意点
        数据准备:为方便演示,需要有紧挨在一起的两个或多个相同的元素
              List<Integer> list=new ArrayList<Integer>();
      list.add(1);
      list.add(2);
      list.add(3);
      list.add(3);
      list.add(4); 

    1. for(int i=0;i<list.size();i++){
    2. if(list.get(i)==3) list.remove(i);
    3. }
    4. 错误,为啥?
    5. 因为ArrayList是一个有序的动态数组
    6. 移除一个后面的元素会往上顶,顶替删除
    7. 元素下标,这样的情况会发生在有相同的
    8. 元素并且相邻紧凑
    9. for(int i=0;i<list.size();i++){
    10. if(list.get(i)==3) list.remove(i--);
    11. }
    12. 正确,为啥?
    13. 因为ArrayList是一个有序的动态数组
    14. 移除一个后面的元素会往上顶,顶替删除
    15. 元素下标,因为删除成功使用了i--
    16. 会再一次比较当前的下标是否符合条件
    17. for(int i=list.size()-1;i>=0;i--){
    18. if(list.get(i)==3){
    19. list.remove(i);
    20. }
    21. }
    22. 正确,为啥?
    23. 因为ArrayList是一个有序的动态数组
    24. 移除一个后面的元素会往上顶,顶替删除
    25. 元素下标,换位思考如果是从后面删除的话
    26. 就算删掉了,下标上的问题也不会错位
    27. for(Integer i:list){
    28. if(i==3) list.remove(i);
    29. }
    30. 错误,??
    31. 因为foreach遍历遵循了迭代器的判定规则
    32. list.remove()删除方法,只是删除了元素
    33. 没有让迭代器 expectedModCount = modCount;
    34. 修改次数和期望次数相等抛出异常
    35. 这里会有一个bug如果刚好删除的是倒数第二位,
    36. 这里不会触发异常
    37. Iterator<Integer> it=list.iterator();
    38. while(it.hasNext()){
    39. if(it.next()==3){
    40. it.remove();
    41. }
    42. }
    43. 正确,??
    44. 因为使用了迭代器,迭代器里面封装好了
    45. 删除时会使expectedModCount = modCount;
    46. 这两个值相等
    47. Iterator<Integer> it=list.iterator();
    48. while(it.hasNext()){
    49. Integer value=it.next();
    50. if(value==3){
    51. list.remove(value);
    52. }
    53. }
    54. 错误,??
    55. 虽然使用了迭代器,但是最终删除调用方法的是list
    56. 这个对象,而不是迭代器实例化的
    57. 最终导致expectedModCount = modCount
    58. 不一致抛出异常
    59. list.remove(2);
    60. 输出结果是什么?
    61. 如果是一个整数类型,则是根据下标删除元素
    62. 如果是对象,就直接删除元素

    LinkedList 解析

    LinkedList底层通过双向链表实现

    LinkedList通过firstlast引用分别指向链表的第一个和最后一个元素。注意这里没有所谓的哑元,当链表为空的时候firstlast都指向null

    LinkedList的实现方式决定了所有跟下标相关的操作都是线性时间,而在首段或者末尾删除元素只需要常数时间。为追求效率LinkedList没有实现同步(synchronized),如果需要多个线程并发访问,可以先采用Collections.synchronizedList()方法对其进行包装

    LinkedList提供额外的get,remove,insert方法在LinkedList的首部或尾部
    线程不安全
    LinkedList可被用作堆栈(stack)【包括了push,pop方法】,队列(queue)或双向队列(deque)
    以双向链表实现,链表无容量限制,允许元素为null,线程不安全
    适合做随机的增加或删除 

     Vector解析

    可用于在需要存储有序的,可动态扩充线程安全的集合。整理逻辑算法上基本与ArrayList相同,但在操做数据的方法上都使用了synchronized关键字,在多 线程调用时,会将并行请求,变为串行请求,因为使用了synchronized方法,所以他的性能方面比ArrayList要差 

    并行性能慢,不建议使用 

     CopyOnWriteArrayList解析

    (拷贝写数组) 是ArrayList线程安全的集合其中所有可变操作(add、set等等)都是通过对底层数组进行一次新的复制来实现的。
    它不存在“扩容”的概念,每次写操作(add 、remove)都要copy一个副本,在副本的基础上修改后改变array引用,所以称为“CopyOnWrite”,因此在写操作是加锁,并且对整个list的copy操作时相当耗时的,过多的写操作不推荐使用该存储结构。读取的方法没有加锁 写的时候才加锁 所以性能 比 vector高

    写时复制
    线程安全
    适合于读多,写少的场景
    写时复制出一个新的数组,完成插入、修改或者移除操作后将新数组赋值给array
    比Vector性能高
    最终一致性
    实现了List接口,使用方式与ArrayList类似

    今天分享就到此结束了 

  • 相关阅读:
    c语言数据结构 二叉树(三)
    交流耐压试验目的
    Docker build报错总结,版本过新大避雷!
    CentOS7中安装VMwareTools(非图形界面)
    ffmpeg抠图
    OpenFeign实现分析、源码解析
    Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution
    最新:Selenium操作已经打开的Chrome(免登录)
    如何系统地自学 Python
    java+jsp基于ssm矿场仓储管理系统-计算机毕业设计
  • 原文地址:https://blog.csdn.net/WZJ278/article/details/125485048