简单分析一下HashMap的原理,put和get方法的原理。
HashMap介绍
HashMap继承Map接口,可以存放key、value键值对,可以在O(1)时间内读取数据。
(1)HashMap内部由数组、单链表、红黑树实现。
(2)通过计算key的Hash值并且和数组长度取余操作来确定元素在数组中的位置。
(3)如果出现多个不同key需要放在数组中的相同位置(Hash碰撞),就使用单链表的形式将他们存放起来。
如果
(4)如果某个链表的长度大于阈值,就将该链表转化为红黑树
(5)如果存放数组的数量大于某个阈值,就会对数组扩容(为了减少Hash碰撞,提高效率),每次扩容后数组的长度都为原来的两倍
HashMap的成员变量
HashMap的构造方法
/**
* 设置默认的容量和默认的负载因子
*/
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
/**
* 设置默认的容量和默认的负载因子
*/
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
/**
* 设置默认的负载因子
*/
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
/**
* 默认的负载因子,并设置初始值
* 如果需要的空间大于门限值,就对数组扩容,然后将所有输入插入数组中
*/
public HashMap(Map extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
int s = m.size();
if (s > 0) {
if (table == null) { // pre-size
float ft = ((float)s / loadFactor) + 1.0F;
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
if (t > threshold)
threshold = tableSizeFor(t);
}
else if (s > threshold)
resize();
for (Map.Entry extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
在构造方法中分别调用了resize()方法进行扩容,调用putVal(hash(key), key, value, false, evict)方法放置数据,这个两个方法十分重要,我们接着看。
put(K key, V value)
放置数据的流程如下图所示,重要的部分我都用红色标注了出来。
下面看源码
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true); //使用hash(int)算法计算key的hash值
}
在put方法中首先使用hash(key)计算了key的hash值,然后调用putVal方法。我们先看以下怎么计算key的hash值。
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
计算hash值是一个静态方法。
1.如果key==null,hash值是0。
2.如果key不是null,将key.hashCode右移16位后与自身相与。(这样的好处是1.计算后得到的hash值与原来32位都有关,减少了hash冲突的几率。2.位移和与运算的计算效率很高)。
计算得到key的hash值后,调用putVal(hash(key), key, value, false, true)方法将数据插入到hash表中。
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node[] tab; Node p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0) //如果table数组是空数组,给数组扩容
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null) //hash&(n-1)是该数据在table数组中的位置。如果该位置没有数据,直接插入。
tab[i] = newNode(hash, key, value, null);
else { //
Node e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k)))) //如果key值和数组中链表头部元素的key值相同。直接覆盖。
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value); //如果元素是树,使用红黑树遍历结点并插入数据。
else {
for (int binCount = 0; ; ++binCount) { //如果元素是链表,遍历链表,如果有重复的key,覆盖,否则,将数据插入到链表最后。
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize(); //如果保存的节点数大于门限值,对数组扩容。
afterNodeInsertion(evict);
return null;
}
上面的代码有几个重要的地方。
1.使用计算得到hash值与数组容量n-1相与(也就是求余数),得到该元素在table中的位置。
2.如果遇到了key值相同的结点,直接用新数据覆盖旧的数据。
3.如果没有key值相同的结点,将新数据插入到链表的末尾。
4.如果链表长度大于TREEIFY_THRESHOLD,需要将链表变为红黑树。
5.如果保存的数据个数大于门限值,需要调用resize()方法对数组扩容。
下面看resize()函数怎么对数组进行扩容。
final Node[] resize() {
Node[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) { //如果现在的容量已经超过最大容量,不再对数组进行扩容。
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && //如果数组容量增大一倍后小于最大容量,就将数组容量增加一倍
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // 否则,维持容量不变
newCap = oldThr;
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node[] newTab = (Node[])new Node[newCap];
table = newTab;
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) { //遍历每个结点,根据hash值计算其在新数组中的位置,并且将结点插入到新数组中。
Node e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode)e).split(this, newTab, j, oldCap);
else { // preserve order
Node loHead = null, loTail = null;
Node hiHead = null, hiTail = null;
Node next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
上面的代码有几个终点:
1.如果数组容量已经是最大了,保持数组容量不变。否则,将数组容量扩大为原来的两倍。
2.如果扩展了数组容量,需要重新计算每个结点在新数组中的位置。计算方法也是先计算key的hash值,计算在新数组中的位置,结算方法是index=(hash&(n-1)),n是新数组的长度。
public V get(Object key)
get方法相对于put方法简单了很多。
根据插入的方法我们大概能推测出来获取的方法。首先计算key的hash值,然后计算在数组中的位置,然后遍历所有结点找到key值相同的元素,返回。
public V get(Object key) {
Node e;
return (e = getNode(hash(key), key)) == null ? null : e.value; //计算hash值,调用getNode查找数据。
}
final Node getNode(int hash, Object key) {
Node[] tab; Node first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
if (first.hash == hash && // always check first node //如果第一个结点就是目标节点,返回
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode) //如果是红黑树,调用红黑树方法查找
return ((TreeNode)first).getTreeNode(hash, key);
do {
if (e.hash == hash && //如果是链表,遍历链表查找结点
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}