哈喽,今天我们来聊聊HashMap。
HashMap相信大家在平时开发的时候也会经常用到,它是基于哈希表的 Map 接口的实现,以key-value的形式存在。
Java 1.8开始HashMap在存储方面用的是数组+链表+红黑树的组合形式。当链表元素达到一定个数时会转为红黑树,小于一定个数时会由红黑树转为链表。
public class HashMap extends AbstractMap implements Map, Cloneable, Serializable
HashMap实现了Map接口,继承AbstractMap。其中Map接口定义了键映射到值的规则,而AbstractMap类提供 Map 接口的骨干实现,以最大限度地减少实现此接口所需的工作。
重要参数
//HashMap默认容量16。
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
//HashMap最大容量1 << 30。
static final int MAXIMUM_CAPACITY = 1 << 30;
//HashMap默认负载因子为0.75,如果HashMap中的元素个数达到了负载因子和容量的积的时候,
//那么HashMap就会扩容,扩容后会重新排列元素位置,这样会消耗性能,所以负载因子的大小也很关键。
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//链表元素达到8个,会将链表转为红黑树。
static final int TREEIFY_THRESHOLD = 8;
//红黑树元素个数小于6个,会将红黑树转为链表。
static final int UNTREEIFY_THRESHOLD = 6;
//容量*负载因子
int threshold;
Node
static class Node implements Map.Entry {
final int hash;
final K key;
V value;
Node next;
Node(int hash, K key, V value, Node next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
......
}
这个是HashMap中的节点,hash是存放hash值。key和value分别对应存入HashMap时传入的key和value,next是在链表的时候指向下一个节点。
接下来看看HashMap的构造函数
HashMap()
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
这个构造函数初始化负载因子为默认值。
HashMap(int initialCapacity)
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
这个构造函数直接调用了另一个构造函数HashMap(int initialCapacity, float loadFactor),并且传入了初始容量initialCapacity,负载因子依旧用的默认值。
HashMap(int initialCapacity, float loadFactor)
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
这个构造函数分别传入了初始容量和负载因子。这里最后调用了tableSizeFor这个方法,因为HashMap的容量为2的次幂,所以当我们传入容量的时候会调用tableSizeFor方法来获取一个最接近我们传入容量的2的次幂。
肯定有人会异或这个threshold参数不是容量乘以负载因子吗,确实是,只不过这里还没有初始化table,在初始化table的时候这个值会重新进行计算的。
HashMap(Map extends K, ? extends V> m)
public HashMap(Map extends K, ? extends V> m) {
//将负载因子设置为默认值0.75。
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
final void putMapEntries(Map extends K, ? extends V> m, boolean evict) {
//获取传入Map的元素个数。
int s = m.size();
if (s > 0) {
if (table == null) { // pre-size
//计算出存入Map适合的HashMap容量。
float ft = ((float)s / loadFactor) + 1.0F;
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
if (t > threshold)
threshold = tableSizeFor(t);
}
else if (s > threshold)
//如果传入Map元素个数大于HaspMap阀值,重新计算HashMap容量。
resize();
//将Map的元素存入HashMap中。
for (Map.Entry extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
关键解释已经写在了代码中。
get(Object key)
public V get(Object key) {
Node e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node getNode(int hash, Object key) {
Node[] tab;
Node first, e;
int n;
K k;
//判断table是否为null,然后根据出入的hash计算出元素在table上相应的位置,并将获取得到元素赋值给first。
//因为这里获取到的可能是链表或者红黑树的第一个元素。
if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) {
//如果first的hash和key和传入的key相匹配,则返回first。
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
//如果为红黑树,则调用getTreeNode方法获取相对应的元素。
if (first instanceof TreeNode)
return ((TreeNode)first).getTreeNode(hash, key);
//如果是链表,则用循环来获取对应的元素。
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
//如果没有找到,则返回null。
return null;
}
关键解释已经在代码中。
put(K key, V value)
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
//这里onlyIfAbsent传入的是false,则为将覆盖现有值。
Node[] tab;
//数组对应位置上的第一个元素
Node p;
int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
//如果table为null,则初始化table。
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
//如果数组相应位置上为null,则表示没有元素,直接将新元素添加到数组。
tab[i] = newNode(hash, key, value, null);
else {
//key和hash值和传入的key相对应的元素
Node e;
K k;
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
//如果传入的key和已有的key一样,将元素赋值给e。
e = p;
else if (p instanceof TreeNode)
//如果为红黑树,这调用putTreeVal方法添将元素赋值给e。
e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
else {
//如果为链表,会判断是否有相同的key,有的话将该元素赋值给e,如果到链表末尾还是没有
//则将元素添加到链表末尾。
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
//如果链表元素个数达到8个,则转换为红黑树
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) {
//如果e不为null,证明找到了有相同key和hash的元素,则直接覆盖。
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
//判断是否需要扩容。
resize();
afterNodeInsertion(evict);
return null;
}
关键解释已经写在代码中。
remove(Object key)
public V remove(Object key) {
Node e;
return (e = removeNode(hash(key), key, null, false, true)) == null ?
null : e.value;
}
final Node removeNode(int hash, Object key, Object value, boolean matchValue, boolean movable) {
Node[] tab;
//数组对应位置的第一个元素。
Node p;
int n, index;
if ((tab = table) != null && (n = tab.length) > 0 && (p = tab[index = (n - 1) & hash]) != null) {
Node node = null, e;
K k;
V v;
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
//如果p相匹配,将p赋值给node。
node = p;
else if ((e = p.next) != null) {
//如果是红黑树,则调用getTreeNode将对应元素找出并赋值给node。
//如果为链表,则用循环将元素找出并赋值给node。
if (p instanceof TreeNode)
node = ((TreeNode)p).getTreeNode(hash, key);
else {
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
p = e;
} while ((e = e.next) != null);
}
}
if (node != null && (!matchValue || (v = node.value) == value || (value != null && value.equals(v)))) {
if (node instanceof TreeNode)
//如果为红黑树,调用removeTreeNode方法删除元素。
((TreeNode)node).removeTreeNode(this, tab, movable);
//不为红黑树,将对应值赋值给链表中的下一个元素。
else if (node == p)
tab[index] = node.next;
else
p.next = node.next;
++modCount;
--size;
afterNodeRemoval(node);
return node;
}
}
return null;
}
关键解释写在了代码中。
clear()
public void clear() {
Node[] tab;
modCount++;
if ((tab = table) != null && size > 0) {
size = 0;
for (int i = 0; i < tab.length; ++i)
tab[i] = null;
}
}
clear方法很简单,就是将数组所有元素设置为null。
到这里HashMap的基本方法就分析完了,里面涉及到红黑树的部分都是一笔带过,感兴趣的同学可以自行了解。
如果上文中有错误的地方欢迎大家指出。