HashMap,HashTable,ConcurrentHashMap

HashMap,HashTable,ConcurrentHashMap_第1张图片

HashMap、HashTable、ConcurrentHashMap都是map接口的实现类

1、HashTable

继承实现情况

  • 任何非空对象都可作为键或值(键值都不能为空)
  • 底层数组+链表实现
  • 线程安全,实现线程安全的方式是在进行修改的时候锁住了整个HashTable,效率低下,ConcurrentHashMap对此进行了优化(分段所)
  • 初始size是11,扩容2*size+1
  • 计算hashCode的方法:直接使用key的hashcode对table数组的长度直接进行取模
  • index = (hash & 0x7FFFFFFF) % tab.length

2、HashMap

继承实现情况

基于hash表的Map接口的实现类,存储形式为一组组的键值对,并且键值都允许为空,键只能最多允许有一个null(key不可重复性),

HashMap类大致相当于 Hashtable,除了它是不同步的,允许空值。

HashMap不保证任何Map的秩序,特别是不保证存储的顺序随时间保持恒定

  • 底层数组+链表(红黑树)存储,键值都可以为空,线程不安全,当链表长度大于8时,将后面的数据放入红黑树存储。
  • 初始size为16,扩容:newsize = oldsize*2,size一定为2的n次幂
  • 扩容针对整个Map,每次扩容时,原来数组中的元素依次重新计算存放位置,并重新插入
  • 当Map中元素总数超过Entry数组的75%,触发扩容操作,为了减少链表长度,元素分配更均匀
  • 计算hashCode方法:计算hash对key的hashcode进行了二次hash,以获得更好的散列值,然后对table数组长度取摸
  • index = hash & (tab.length – 1)

 

  • hash冲突

当多个键值对通过键计算出来的hashCode是相同的话就会出现hash冲突

解决此冲突常用的是链地址法,即在数组角标上加一个链表,冲突发生的时候就将新的键值对加在链表上。进行查找的时候,先通过hashCode找到数组角标,再遍历链表通过key.equals()方法确定位置。

  • 加载因子

为了降低哈希冲突的概率,默认当HashMap中的键值对达到数组大小的75%时,即会触发扩容。因此,如果预估容量是100,即需要设定100/0.75=134的数组大小。

加载因子还可以通过构造函数根据实际情况由程序员指定。加载因子越小,查找的效率越快,空间成本越大(用空间换时间)

 

3、ConcurrentHashMap

继承实现情况

  • 底层采用分段的数组+数组+链表(红黑树)实现,线程安全
  • 通过把整个Map分为N个Segment,可以提供相同的线程安全,但是效率提升N倍,默认提升16倍。(读操作不加锁,由于HashEntry的value变量是 volatile的,也能保证读取到最新的值。)
  • Hashtable的synchronized是针对整张Hash表的,即每次锁住整张表让线程独占,ConcurrentHashMap允许多个修改操作并发进行,其关键在于使用了锁分离技术
  • 有些方法需要跨段,比如size()和containsValue(),它们可能需要锁定整个表而而不仅仅是某个段,这需要按顺序锁定所有段,操作完毕后,又按顺序释放所有段的锁
  • 扩容:段内扩容(段内元素超过该段对应Entry数组长度的75%触发扩容,不会对整个Map进行扩容),插入前检测需不需要扩容,有效避免无效扩容
  • ConcurrentHashMap默认将hash表分为16个桶,诸如get、put、remove等常用操作只锁住当前需要用到的桶。这样,原来只能一个线程进入,现在却能同时有16个写线程执行,并发性能的提升是显而易见的。

 

 

 

你可能感兴趣的:(集合,HashMap,HashTable)