• java面试——集合HashMap源码理解问题


    HashMap

    • 底层数据结构,1.7与1.8有何不同?
      • 1.7 数组+链表,1.8 数组+ (链表 | 红黑树)
    • 为何要用红黑树,为何一上来不树化,树化阈值为何是8,何时会树化,何时会退化为链表?
      • 链表太长会影响性能
      • 链表短时,树化效率并不比链表高,占内存多
      • 红黑树用来避免DoS攻击,防止链表超长时性能下降,树化应当是偶然情况,正常情况下链表长度不会超过8。hash值如果足够随机,则在hash表内按泊松分布,在负载因子0.75的情况下,长度超过8的链表出现概率是0.00000006,选择8就是为了让树化几率足够小。
      • 条件1:链表长度是大于8,条件2:数组长度大于64。若条件1成立且数组长度小于64时会扩容
      • 情况1:扩容后拆分树,树节点小于等于6。情况2:退化情况2: remove树节点时,移除前判断,若root、root.left、root.right、root.left.left有一个为null ,也会退化为链表

    扩容、树化:元素个数超过数组的3/4时,会进行扩容,树化阈值是8,条件1:链表长度是大于8,条件2:数组长度大于64。若数组长度小于64时会扩容,万不得已才树化。

    • 索引如何计算? hashCode 都有了,为何还要提供 hash()方法?数组容量为何是2的n次幂?

      • 计算对象的hashCode(),再进行调用HashMap的 hash()方法进行二次哈希,最后&(capacity - 1)(或者取模数组长度)得到索引。
      • 为了使最终用来计算索引的hashcode值分布得更均匀,降低链表长度。
      • 计算索引时,如果是2的n次幂可以使用位与运算代替取模,效率更高;扩容时 hash & (按位与运算)oldCap==0的元素留在原来位置,否则新位置=旧位置+ oldCap
    • 介绍一下put方法流程,1.7和1.8有何不同?

      • HashMap是懒惰创建数组的,在首次使用才创建数组
      • 计算索引
      • 如果索引还没被占用,创建Node占位返回
      • 如果索引已经被占用
        • 已经是TreeNode走红黑树的添加或更新逻辑
        • 是普通Node,走链表的添加或更新逻辑,如果超过树化阈值,走树化逻辑
      • 返回前检查容量是否超扩容阈值,如果超过就扩容。
      • 不同点
        • 链表插入节点时,1.7是头插法、1.8是尾插法
        • 1.7是大于等于阈值且插入时该位置已经被占用才扩容,而1.8是大于阈值就扩容
        • 1.8在扩容计算Node索引时,会优化
    • 加载因子为何默认是0.75f

      • 在空间占用何查询时间之间取得较好的平衡
        • 大了,链表可能过长
        • 小了,经常扩容,浪费空间
    • 多线程下会有什么问题?

      • 可能会丢失数据

      • 扩容死链(1.7)

      • 数据错乱(1.7、.18)

    • key能否为null,作为key的对象有什么要求?

      • HashMap的key可以为null,但其他的Map就不一定了。
      • 作为key的对象,必须实现hashCode何equals,并且key的内容不能修改(不可变)。
  • 相关阅读:
    Spring Security—Spring MVC 整合
    Linux | 网络服务管理相关不完全总结
    监督学习:从数据中学习预测模型的艺术与科学
    LeetCode每日一题——667. 优美的排列 II
    【C++】类和对象 从入门到超神 (中)
    LockSupport-park和unpark编码实战
    C和指针 第12章 使用结构和指针 12.2 单链表
    精灵宝可梦属性克制表(精灵属性相克图)
    【cocos creator】编辑器里自动播放spine动画
    如何让docker history出来的东西不缩略显示,不截断
  • 原文地址:https://blog.csdn.net/student_hwj/article/details/126878319