Java 集合, 也叫作容器,主要是由两大接口派生而来:一个是 Collection
接口,主要用于存放单一元素;另一个是 Map
接口,主要用于存放键值对。对于Collection
接口,下面又有三个主要的子接口:List
、Set
和 Queue
。
注:图中只列举了主要的继承派生关系,并没有列举所有关系。比方省略了AbstractList
, NavigableSet
等抽象类以及其他的一些辅助类,如想深入了解,可自行查看源码。
List
(对付顺序的好帮手): 存储的元素是有序的、可重复的。Set
(注重独一无二的性质): 存储的元素不可重复的。Queue
(实现排队功能的叫号机): 按特定的排队规则来确定先后顺序,存储的元素是有序的、可重复的。Map
(用 key 来搜索的专家): 使用键值对(key-value)存储,类似于数学上的函数 y=f(x),"x" 代表 key,"y" 代表 value,key 是无序的、不可重复的,value 是无序的、可重复的,每个键最多映射到一个值。先来看一下 Collection
接口下面的集合。
ArrayList
:Object[]
数组。详细可以查看:ArrayList 源码分析。Vector
:Object[]
数组。LinkedList
:双向链表(JDK1.6 之前为循环链表,JDK1.7 取消了循环)。详细可以查看:LinkedList 源码分析。HashSet
(无序,唯一): 基于 HashMap
实现的,底层采用 HashMap
来保存元素。LinkedHashSet
: LinkedHashSet
是 HashSet
的子类,并且其内部是通过 LinkedHashMap
来实现的。TreeSet
(有序,唯一): 红黑树(自平衡的排序二叉树)。PriorityQueue
: Object[]
数组来实现小顶堆。详细可以查看:PriorityQueue 源码分析。DelayQueue
:PriorityQueue
。详细可以查看:DelayQueue 源码分析。ArrayDeque
: 可扩容动态双向数组。HashMap
:JDK1.8 之前 HashMap
由数组+链表组成的,数组是 HashMap
的主体,链表则是主要为了解决哈希冲突而存在的(“拉链法”解决冲突)。JDK1.8 以后在解决哈希冲突时有了较大的变化,当链表长度大于阈值(默认为 8)(将链表转换成红黑树前会判断,如果当前数组的长度小于 64,那么会选择先进行数组扩容,而不是转换为红黑树)时,将链表转化为红黑树,以减少搜索时间。详细可以查看:HashMap 源码分析。LinkedHashMap
:LinkedHashMap
继承自 HashMap
,所以它的底层仍然是基于拉链式散列结构即由数组和链表或红黑树组成。另外,LinkedHashMap
在上面结构的基础上,增加了一条双向链表,使得上面的结构可以保持键值对的插入顺序。同时通过对链表进行相应的操作,实现了访问顺序相关逻辑。详细可以查看:LinkedHashMap 源码分析Hashtable
:数组+链表组成的,数组是 Hashtable
的主体,链表则是主要为了解决哈希冲突而存在的。TreeMap
:红黑树(自平衡的排序二叉树)。我们主要根据集合的特点来选择合适的集合。比如:
Map
接口下的集合,需要排序时选择 TreeMap
,不需要排序时就选择 HashMap
,需要保证线程安全就选用 ConcurrentHashMap
。Collection
接口的集合,需要保证元素唯一时选择实现 Set
接口的集合比如 TreeSet
或 HashSet
,不需要就选择实现 List
接口的比如 ArrayList
或 LinkedList
,然后再根据实现这些接口的集合的特点来选用。当我们需要存储一组类型相同的数据时,数组是最常用且最基本的容器之一。但是,使用数组存储对象存在一些不足之处,因为在实际开发中,存储的数据类型多种多样且数量不确定。这时,Java 集合就派上用场了。与数组相比,Java 集合提供了更灵活、更有效的方法来存储多个数据对象。Java 集合框架中的各种集合类和接口可以存储不同类型和数量的对象,同时还具有多样化的操作方式。相较于数组,Java 集合的优势在于它们的大小可变、支持泛型、具有内建算法等。总的来说,Java 集合提高了数据的存储和处理灵活性,可以更好地适应现代软件开发中多样化的数据需求,并支持高质量的代码编写。
ArrayList
内部基于动态数组实现,比 Array
(静态数组) 使用起来更加灵活:
ArrayList
会根据实际存储的元素动态地扩容或缩容,而 Array
被创建之后就不能改变它的长度了。ArrayList
允许你使用泛型来确保类型安全,Array
则不可以。ArrayList
中只能存储对象。对于基本类型数据,需要使用其对应的包装类(如 Integer、Double 等)。Array
可以直接存储基本类型数据,也可以存储对象。ArrayList
支持插入、删除、遍历等常见操作,并且提供了丰富的 API 操作方法,比如 add()
、remove()
等。Array
只是一个固定长度的数组,只能按照下标访问其中的元素,不具备动态添加、删除元素的能力。ArrayList
创建时不需要指定大小,而Array
创建时必须指定大小。下面是二者使用的简单对比:
Array
:
- // 初始化一个 String 类型的数组
- String[] stringArr = new String[]{"hello", "world", "!"};
- // 修改数组元素的值
- stringArr[0] = "goodbye";
- System.out.println(Arrays.toString(stringArr));// [goodbye, world, !]
- // 删除数组中的元素,需要手动移动后面的元素
- for (int i = 0; i < stringArr.length - 1; i++) {
- stringArr[i] = stringArr[i + 1];
- }
- stringArr[stringArr.length - 1] = null;
- System.out.println(Arrays.toString(stringArr));// [world, !, null]
ArrayList
:
- // 初始化一个 String 类型的 ArrayList
- ArrayList
stringList = new ArrayList<>(Arrays.asList("hello", "world", "!")); - // 添加元素到 ArrayList 中
- stringList.add("goodbye");
- System.out.println(stringList);// [hello, world, !, goodbye]
- // 修改 ArrayList 中的元素
- stringList.set(0, "hi");
- System.out.println(stringList);// [hi, world, !, goodbye]
- // 删除 ArrayList 中的元素
- stringList.remove(0);
- System.out.println(stringList); // [world, !, goodbye]
ArrayList
是 List
的主要实现类,底层使用 Object[]
存储,适用于频繁的查找工作,线程不安全 。Vector
是 List
的古老实现类,底层使用Object[]
存储,线程安全。Vector
和 Stack
两者都是线程安全的,都是使用 synchronized
关键字进行同步处理。Stack
继承自 Vector
,是一个后进先出的栈,而 Vector
是一个列表。随着 Java 并发编程的发展,Vector
和 Stack
已经被淘汰,推荐使用并发集合类(例如 ConcurrentHashMap
、CopyOnWriteArrayList
等)或者手动实现线程安全的方法来提供安全的多线程操作支持。
ArrayList
中可以存储任何类型的对象,包括 null
值。不过,不建议向ArrayList
中添加 null
值, null
值无意义,会让代码难以维护比如忘记做判空处理就会导致空指针异常。
- ArrayList
listOfStrings = new ArrayList<>(); - listOfStrings.add(null);
- listOfStrings.add("java");
- System.out.println(listOfStrings);
[null, java]
对于插入:
ArrayList
的容量未达到极限时,往列表末尾插入元素的时间复杂度是 O(1),因为它只需要在数组末尾添加一个元素即可;当容量已达到极限并且需要扩容时,则需要执行一次 O(n) 的操作将原数组复制到新的更大的数组中,然后再执行 O(1) 的操作添加元素。对于删除:
这里简单列举一个例子:假如我们要删除节点 9 的话,需要先遍历链表找到该节点。然后,再执行相应节点指针指向的更改,具体的源码可以参考:LinkedList 源码分析 。