• JAVA集合问答


    HashMap 的扩容过程

    当向容器添加元素的时候,会判断当前容器的元素个数,如果大于等于阈值---即当前数组的长度乘以加载因子的值的时候,就要自动扩容啦。

    扩容( resize )就是重新计算容量,向 HashMap 对象里不停的添加元素,而 HashMap 对象内部的数组无法装载更 多的元素时,对象就需要扩大数组的长度,以便能装入更多的元素。

    当然 Java 里的数组是无法自动扩容的,方法 是使用一个新的数组代替已有的容量小的数组,就像我们用一个小桶装水,如果想装更多的水,就得换大水桶。

    HashMap hashMap=new HashMap(cap);

    cap =3, hashMap 的容量为4;

    cap =4, hashMap 的容量为4;

    cap =5, hashMap 的容量为8;

    cap =9, hashMap 的容量为16;

    如果 cap 是2的n次方,则容量为 cap ,否则为大于 cap 的第一个2的n次方的数。

    数组扩容的过程?

    创建一个新的数组,其容量为旧数组的两倍,并重新计算旧数组中结点的存储位置。结点在新数组中的位置只有两种,原下标位置或原下标+旧数组的大小。

    对红黑树的见解?
    • 1、每个节点非红即黑

    • 2、根节点总是黑色的

    • 3、如果节点是红色的,则它的子节点必须是黑色的(反之不一定)

    • 4、每个叶子节点都是黑色的空节点(NIL节点)

    • 5、从根节点到叶节点或空子节点的每条路径,必须包含相同数目的黑色节点(即相同的黑色高度)

    jdk8中对HashMap做了哪些改变?
    • 在java 1.8中,如果链表的长度超过了8,那么链表将转换为红黑树。(桶的数量必须大于64,小于64的时候只会扩容)

    • 发生hash碰撞时,java 1.7 会在链表的头部插入,而java 1.8会在链表的尾部插入

    • 在java 1.8中,Entry被Node替代(换了一个马甲)。

    HashMap,LinkedHashMap,TreeMap 有什么区别?

    HashMap 参考其他问题;

    LinkedHashMap 保存了记录的插入顺序,在用 Iterator 遍历时,先取到的记录肯定是先插入的;遍历比 HashMap 慢;

    TreeMap 实现 SortMap 接口,能够把它保存的记录根据键排序(默认按键值升序排序,也可以指定排序的比较器)

    HashMap & TreeMap & LinkedHashMap 使用场景?

    一般情况下,使用最多的是 HashMap。

    HashMap:在 Map 中插入、删除和定位元素时;

    TreeMap:在需要按自然顺序或自定义顺序遍历键的情况下;

    LinkedHashMap:在需要输出的顺序和输入的顺序相同的情况下。

    HashMap 和 HashTable 有什么区别?

    ①、HashMap 是线程不安全的,HashTable 是线程安全的;

    ②、由于线程安全,所以 HashTable 的效率比不上 HashMap;

    ③、HashMap最多只允许一条记录的键为null,允许多条记录的值为null,而 HashTable不允许;

    ④、HashMap 默认初始化数组的大小为16,HashTable 为 11,前者扩容时,扩大两倍,后者扩大两倍+1;

    ⑤、HashMap 需要重新计算 hash 值,而 HashTable 直接使用对象的 hashCode

    Java 中的另一个线程安全的与 HashMap 极其类似的类是什么?同样是线程安全,它与 HashTable 在线程同步上有什么不同?

    ConcurrentHashMap 类(是 Java并发包 java.util.concurrent 中提供的一个线程安全且高效的 HashMap 实现)。

    HashTable 是使用 synchronize 关键字加锁的原理(就是对对象加锁);

    而针对 ConcurrentHashMap,在 JDK 1.7 中采用 分段锁的方式;JDK 1.8 中直接采用了CAS(无锁算法)+ synchronized。

    HashMap & ConcurrentHashMap 的区别?

    除了加锁,原理上无太大区别。另外,HashMap 的键值对允许有null,但是ConCurrentHashMap 都不允许。

    为什么 ConcurrentHashMap 比 HashTable 效率要高?

    HashTable 使用一把锁(锁住整个链表结构)处理并发问题,多个线程竞争一把锁,容易阻塞;

    ConcurrentHashMap

    • JDK 1.7 中使用分段锁(ReentrantLock + Segment + HashEntry),相当于把一个 HashMap 分成多个段,每段分配一把锁,这样支持多线程访问。锁粒度:基于 Segment,包含多个 HashEntry。

    • JDK 1.8 中使用 CAS + synchronized + Node + 红黑树。锁粒度:Node(首结点)(实现 Map.Entry)。锁粒度降低了。

    ConcurrentHashMap 在 JDK 1.8 中,为什么要使用内置锁 synchronized 来代替重入锁 ReentrantLock?

    ①、粒度降低了;

    ②、JVM 开发团队没有放弃 synchronized,而且基于 JVM 的 synchronized 优化空间更大,更加自然。

    ③、在大量的数据操作下,对于 JVM 的内存压力,基于 API 的 ReentrantLock 会开销更多的内存。

    ConcurrentHashMap 简单介绍?

    ①、重要的常量:

    private transient volatile int sizeCtl;

    当为负数时,-1 表示正在初始化,-N 表示 N - 1 个线程正在进行扩容;

    当为 0 时,表示 table 还没有初始化;

    当为其他正数时,表示初始化或者下一次进行扩容的大小。

    ②、数据结构:

    Node 是存储结构的基本单元,继承 HashMap 中的 Entry,用于存储数据;

    TreeNode 继承 Node,但是数据结构换成了二叉树结构,是红黑树的存储结构,用于红黑树中存储数据;

    TreeBin 是封装 TreeNode 的容器,提供转换红黑树的一些条件和锁的控制。

    ③、存储对象时(put() 方法):

    1.如果没有初始化,就调用 initTable() 方法来进行初始化;

    2.如果没有 hash 冲突就直接 CAS 无锁插入;

    3.如果需要扩容,就先进行扩容;

    4.如果存在 hash 冲突,就加锁来保证线程安全,两种情况:一种是链表形式就直接遍历到尾端插入,一种是红黑树就按照红黑树结构插入;

    5.如果该链表的数量大于阀值 8,就要先转换成红黑树的结构,break 再一次进入循环

    6.如果添加成功就调用 addCount() 方法统计 size,并且检查是否需要扩容。

    ④、扩容方法 transfer():默认容量为 16,扩容时,容量变为原来的两倍。

    helpTransfer():调用多个工作线程一起帮助进行扩容,这样的效率就会更高。

    ⑤、获取对象时(get()方法):

    1.计算 hash 值,定位到该 table 索引位置,如果是首结点符合就返回;

    2.如果遇到扩容时,会调用标记正在扩容结点 ForwardingNode.find()方法,查找该结点,匹配就返回;

    3.以上都不符合的话,就往下遍历结点,匹配就返回,否则最后就返回 null。

  • 相关阅读:
    docker基础命令操作---容器操作
    霍夫曼树(Huffman Tree)
    linux批量修改多个文件的同一部分内容
    机械臂B样条插补+带源代码
    Git学习笔记1
    【大数据开发技术】实验03-Hadoop读取文件
    NIO+代码实现---Buffer+Channel+Selector
    swig教程-指令文件《一》
    算法---找出数组中的所有孤独数字(Kotlin)
    Spring中用了哪些设计模式
  • 原文地址:https://blog.csdn.net/wujianyouhun/article/details/136432478