常见的几个map比较有HashMap,ConcurrentHashMap,HashTable,ConcurrentHashMap,TreeMap
HashMap
底层结构
数组+链表+红黑树
初始化逻辑
初始化时判断是否有指定数组长度,如果没有,则按照默认的数组长度16,默认负载因子为0.75。如果有指定长度则按照指定数组长度去计算阈值
存数据
hash表中数据的存储形式是键值对。当存入一个数据时,先会拿key与数组长度做hash运算,计算出在数组中的索引,如果该索引空间里不存在数据,则把该数据放入进去。如果存在,则比较这两个对象的hash值,如果hash值不一样,则在此空间中划出一个节点,将该数据键值对存入进去。如果hash值一样,则发生了hash冲突。这时底层就会调用equals方法,比较内容,如果内容相同,则用新的value值覆盖旧的value值,如果不同,则向下比较,如果一直不同,则创建一个节点,加在链表后面,存入该数据,如果链表长度超过了8,则链表转化为红黑树,将原来链表数据,拷贝到红黑树里面。
扩容
什么时候会扩容?
到达阈值的时候会进行扩容,如hashmap的默认初始化长度时16,默认的负载因子是0.75,所以数组长度达到(等于)12的时候会扩容。每次扩容的时候会将原来数组里面的内容放到新的数组里面,每个元素的位置会重新进行hash值计算。
扩容后长度怎么计算?
默认扩容的长度是原来长度的2倍,最大长度是Integer.MAX_VALUE.
由于动态扩容机制的存在,在使用集合的时候需要初始化的时候指定数组长度。
为什么扩容因子是0.75?
扩容因子表示hash表中元素的填充程度,扩容因子越大,表示触发扩容的元素个数越多,虽然它的整体空间利用率比较高,但它的hash冲突率也比较高。反过来说,它的值越小,则触发扩容元素的个数越少,hash冲突率越低,但是对于内存空间的浪费率就增多了,而且会频繁触发扩容,因此扩容因子的设置,本身就是一个概率问题。hashmap里面是采用链式寻址的方法解决hash冲突,而为了避免链表过长, 而带来的时间复杂度增加的问题,所以会在链表长度>=7的时候,就会转换成红黑树,提升检索的效率。当扩容因子在0.75的时候,链表长度达到8可能性几乎为0.比较好的达到了时间成本和空间成本的平衡。计算是使用泊松分布去计算出来的一个平衡值
和ConcurrentHashMap区别
concurrentHashMap相当于hashmap的多线程版本。
1.7 Segment + hashEntry 给Segment添加ReetrantLock锁来实现线程安全
1.8 通过CAS或Synchronized来实现线程安全。粒度的控制,分段锁的设计