• Java源码分析:Guava之不可变集合ImmutableMap的源码分析


    原创/朱季谦

    一、案例场景

    遇到过这样的场景,在定义一个static修饰的Map时,使用了大量的put()方法赋值,就类似这样——

    1. public static final Map dayMap= new HashMap<>();
    2. static {
    3. dayMap.put("Monday","今天上英语课");
    4. dayMap.put("Tuesday","今天上语文课");
    5. dayMap.put("Wednesday","今天上数学课");
    6. dayMap.put("Thursday","今天上音乐课");
    7. dayMap.put("Sunday","今天上编程课");
    8. ......
    9. }

    当时,我就在想,是否可以进一步优化下,使得代码看起来更为优雅些,然后,就发现了Google Guava里的有一个类ImmutableMap,通过这个类可以实现类似建造者模式的链式编程,优化后的效果,如下:

    1. public static final Map dayMap = ImmutableMap.builder()
    2. .put("Monday","今天上英语课")
    3. .put("Tuesday","今天上语文课")
    4. .put("Wednesday","今天上数学课")
    5. .put("Thursday","今天上音乐课")
    6. .put("Sunday","今天上编程课")
    7. .build();

    二、ImmutableMap源码分析

    那么,这个ImmutableMap究竟是如何实现这样的功能呢?

    在Google Guava官方教程中,Immutable前缀的集合被定义为不可变集合,包括ImmutableSet、 ImmutableMap等,何为不可变集合?就是指,在集合创建后,集合里所有的状态在生命周期内都不可再修改了,只能读。

    那么,什么是可再修改的呢,像Jdk中的map、list等,创建后,还可以再通过put()或者add()反复新增或者修改,这种就是可再修改的集合。既然是不可再修改集合,是不是就一定不能再修改了呢?也不是,其实,通过反射还是可以被修改的,但这已经不是不可变集合之所以存在的初衷了。

    总结一句话是,不可变集合是线程安全的且可当成常量使用的。

    接下来,就进入到ImmutableMap内部,可以看到,其实现了Map接口,跟HashMap有点类似地方在于,Map接口都算是他们的基类,都可以实现父类引用指向子类对象,即向上转型。

    public abstract class ImmutableMap implements Map, Serializable {}
    

    这是一个抽象类,若要实现这样调用 ImmutableMap.builder(),表面上就可以猜测到builder()一定是被static定义的静态方法,进到源码里,发现确实如此——

    1. /**
    2. * Returns a new builder. The generated builder is equivalent to the builder
    3. * created by the {@link Builder} constructor.
    4. */
    5. public static Builder builder() {
    6. return new Builder();
    7. }

    这个方法的定义对于一些初级程序员而言,可能会觉得很奇怪,其实这个方法格式的本质是这样的 ——

    public  T method(T t)
    

    这是一种泛型的约定规范,第一个定义一种泛型,表示当前方法有一个范型变量类型,用T表示;第二个T是表示method的返回类型为T。

    回过头来看这个builder()方法,就很好理解了,是定义一种泛型,表示当前方法的泛型变量,Builder表示返回一个泛型变量为的对象。

    前面定义 ImmutableMap.builder(),在这个builder()方法里,就会返回一个new Builder()的对象,这个对象通过构造器,初始化了一个大小为ImmutableCollection.Builder.DEFAULT_INITIAL_CAPACITY的数组entries,而这个DEFAULT_INITIAL_CAPACITY的默认值是4。

    1. public static class Builder {
    2. Comparatorsuper V> valueComparator;
    3. ImmutableMapEntry[] entries;
    4. int size;
    5. boolean entriesUsed;
    6. public Builder() {
    7. this(ImmutableCollection.Builder.DEFAULT_INITIAL_CAPACITY);
    8. }
    9. Builder(int initialCapacity) {
    10. this.entries = new ImmutableMapEntry[initialCapacity];
    11. this.size = 0;
    12. this.entriesUsed = false;
    13. }
    14. ......
    15. }

    那么问题来了,这个 ImmutableMapEntry[] 是什么类型的数组呢?

    这个ImmutableMapEntry类 ,是继承一个ImmutableEntry类 ——

    1. class ImmutableMapEntry extends ImmutableEntry {
    2. static ImmutableMapEntry[] createEntryArray(int size) {
    3. return new ImmutableMapEntry[size];
    4. }
    5. ImmutableMapEntry(K key, V value) {
    6. super(key, value);
    7. checkEntryNotNull(key, value);
    8. }
    9. }

    注意一点, checkEntryNotNull(key, value)做了一个校验,这就意味着,存入的key和value值都不能为空。

    1. static void checkEntryNotNull(Object key, Object value) {
    2. if (key == null) {
    3. throw new NullPointerException("null key in entry: null=" + value);
    4. } else if (value == null) {
    5. throw new NullPointerException("null value in entry: " + key + "=null");
    6. }
    7. }

    在父类ImmutableEntry类里,定义了key和value两个泛型变量,可见,当外部调用builder().put(key,value)来存储key-value数据时,其实是将key-value数据存储到ImmutableEntry对象的key与value里。

    1. class ImmutableEntry extends AbstractMapEntry implements Serializable {
    2. final K key;
    3. final V value;
    4. ......
    5. }

    提到ImmutableEntry数组来存储key-value数据,就不得不提一下HashMap。

    在JDK1.8当中,HashMap是由数组+链表+红黑树组成,它内部的数组是由Node[]定义,而这个 Node 实现的是Map.Entry——

    image

    ImmutableMapEntry顶部同样是实现了Entry——

    image

    可见,ImmutableMap与HashMap一样,其存储key-value的对象所属的类,都直接或者间接地实现了Entry接口。

    分析到这里,再看回Builder类源码,就很容易明白 ,这个ImmutableMapEntry[] entries与HashMap的数组类似,都是用来存储key-value的数据。

    接下来,就是分析put的逻辑原理了。

    前面分析到的Builder类,其实是属于抽象类 ImmutableMap中的内部静态类,这就意味着,执行ImmutableMap.builder().put("Monday","今天上英语课")的本质,其实是相当于执行了ImmutableMap.new Builder().put("Monday","今天上英语课")。

    put方法的源码如下:

    1. public Builder put(K key, V value) {
    2. ensureCapacity(size + 1);
    3. ImmutableMapEntry entry = entryOf(key, value);
    4. // don't inline this: we want to fail atomically if key or value is null
    5. entries[size++] = entry;
    6. return this;
    7. }

    一、先看第一行代码调用的方法,其作用是判断当新增一个key-value对象存到数组时,是否会有溢出的可能,若出现溢出的情况,就先对数组进行扩容。

    1. private void ensureCapacity(int minCapacity) {
    2. if (minCapacity > entries.length) {
    3. entries =
    4. Arrays.copyOf(
    5. entries, ImmutableCollection.Builder.expandedCapacity(entries.length, minCapacity));
    6. entriesUsed = false;
    7. }
    8. }

    二、第二行ImmutableMapEntry entry = entryOf(key, value)就是创建一个新的ImmutableMapEntry对象,通过构造器初始化赋值给对象的key与value——

    1. static ImmutableMapEntry entryOf(K key, V value) {
    2. return new ImmutableMapEntry(key, value);
    3. }

    三、第三行代码 entries[size++] = entry是将新增的ImmutableMapEntry对象存储到数组空闲的位置上,这样通过put(key,value)缓存进来的key-value值,就通过对象的形式存入到了数组当中。

    四、最后一行,是返回一个this,ImmutableMap能实现链式编程的原因,就是在这个this上。

    当理解了这个this,就会理解ImmutableMap设计的精妙之处。

    当我们使用链式编程ImmutableMap.builder().put("key1","value1").put("key2","value2") .put("key2","value3")来赋值时,其内部就是反复调用了内部静态类Builder当中的put()方法,那么问题来了,为什么能反复调用呢?

    答案就是这个返回的this,其返回的还是Builder对象本身啊,Builderd对象当然可以继续调用其put方法了。在这个反复调用的过程中, 只有entries[size++] 是一直在新增变化的。

    这其实是建造者设计模式的一种体现,只不过平常遇到的建造者设计模式,大多都是将对象的各个属性灵活进行拼装,组成一个定制化的对象,而这里,则是灵活去定制化一个数组存储情况。

    最后就是,就是执行.build()方法了——

    1. ImmutableMap.builder()
    2. .put("Monday","今天上英语课")
    3. ......
    4. .build();

    这个build()源码里写的很复杂,这里直接简单优化了下,大概意思,就是将entries数组包装成一个实现Map接口的子对象进行返回。

    1. public ImmutableMap build() {
    2. switch (size) {
    3. case 0:
    4. return of();
    5. case 1:
    6. return new SingletonImmutableBiMap(k1, v1);
    7. default:
    8. return new RegularImmutableMap(entries, table, mask);
    9. }
    10. }

    当数组长度超过1时,其可以返回SingletonImmutableBiMap或者RegularImmutableMap,两者都是间接实现了Map接口,对比一下各自的类定义——

    1. final class SingletonImmutableBiMap extends ImmutableBiMap {
    2. final transient K singleKey;
    3. final transient V singleValue;
    4. ......
    5. }
    1. final class RegularImmutableMap extends ImmutableMap {
    2. // entries in insertion order
    3. private final transient Entry[] entries;
    4. // array of linked lists of entries
    5. private final transient ImmutableMapEntry[] table;
    6. // 'and' with an int to get a table index
    7. private final transient int mask;
    8. ......
    9. }

    发现,都有一个共同特点,类与类中的属性,都是以final修饰符来定义的,这就意味着,一旦调用build()方法创建初始化后,就不可以再改变了。

    这就是ImmutableMap集合不可变的真正原因所在。

    最后,还有一个问题是,当通过ImmutableMap创建完成一个Map对象后,再试图通过put来插入数据时,会发生什么情况呢?

    这时,再通过put方法调用时,例如,以上边定义的dayMap为例,在某个方法里,再试图通过dayMap..put("Monday","今天上英语课") 来修改或者新增map数据时,这里调用的put就已经不是内部类Builder()里的put方法了,而是ImmutableMap本身的put方法,这个方法的源码如下——

    1. /**
    2. * Guaranteed to throw an exception and leave the map unmodified.
    3. *
    4. * @throws UnsupportedOperationException always
    5. * @deprecated Unsupported operation.
    6. */
    7. @CanIgnoreReturnValue
    8. @Deprecated
    9. @Override
    10. public final V put(K k, V v) {
    11. throw new UnsupportedOperationException();
    12. }

    其注释表示,map unmodified,即无法再被修改,若仍调用put执行,只会喜提一个异常 UnsupportedOperationException。

  • 相关阅读:
    阿里云轻量应用服务器如何快速搭建WordPress个人博客?
    LeetCode_443_压缩字符串
    mindspore.scipy 入门使用指导
    解析ChatGPT Plus相比chatgpt3.5有哪些优势
    WPF动画小知识
    使用 HTTP PUT, PATCH 以及 MERGE 请求消费 SAP ABAP OData 服务修改操作的实现及其区别试读版
    ETL:数据转换与集成的关键过程
    STM32 基础知识
    云计算 入门名词
    Redis7学习笔记01
  • 原文地址:https://blog.csdn.net/weixin_40706420/article/details/134473713