关于java和scala当中HashMap的原理总结

HashMap是基于数据结构哈希表的原理,在jdk1.8之前底层的存储结构是数组加链表,在jdk1.8包括1.8之后存储结构是数组加链表或者红黑树。

1、put():当调用put方法往hashmap里存放对象的时候,首先会将这个key-value键值对实例化成一个Entry对象,然后会调用key的hashCode()方法,取得hash值之后,会根据hash值与数组的长度取模的结果找到其应该存放的位置,放的时候,会先检查对应的位置有没有数据,如果没有,直接放入,如果有的话,会调用两个key的equals()方法,如果返回true,那么新的value会覆盖原来的value,如果返回false,那么会将这个Entry与原来的Entry形成一个链,也就是链表,并且新的Entry会放在链表的头部

2、get():当调用get方法时,会先调用key的hashCode()方法,找到其存在的位置,然后再调用key的equals()方法,找到其对应的Entry,将value取出

3、resize():当数据越来越多的时候意味着碰撞的几率越来越高,碰撞的几率高的话,意味着查询的效率下降,所以hashmap又提供了数组扩容的方法(hashmap的默认长度是16),当数据长度超过hashmap的长度*loadFactor(loadFactor默认是0.75)的时候,hashmap的长度会扩大一倍,但当长度扩大的时候,意味着要重新计算每个元素在数组中的位置,这是一个非常耗费性能的操作,所以当创建hashmap对象的时候,如果已知数据量的多少,比如数据的长度是1000,可以通过new HashMap(1000)来解决,其实1000和1024是一样的,都会开辟1024个空间,但要主要,是超过数组长度的0.75的时候就会扩容,所以应该new HashMap(2048),这样子便可以一次性创建,防止后续的扩容问题

 

注意一下几个属性

//链表转换成树的阈值 
static final int TREEIFY_THRESHOLD = 8; 
//树转换成链表的阈值(执行resize操作时,当桶中bin的数量少于UNTREEIFY_THRESHOLD时使用链表来代替树) 
static final int UNTREEIFY_THRESHOLD = 6; 
//在转变成树之前,还会有一次判断,只有键值对数量大于 64 才会发生转换。 
//这是为了避免在哈希表建立初期,多个键值对恰 好被放入了同一个链表中而导致不必要的转化。 
static final int MIN_TREEIFY_CAPACITY = 64;

你可能感兴趣的:(java)