哈希表:也叫散列表,是根据关键码值而直接进行访问的数据结构,即它通过把关键码值来映射到表的一个位置来访问记录,以加快查找速度,这个映射函数叫哈希函数;
图片来自网络
常用的哈希函数 :
解决哈希冲突的方法:
开放寻址法:Hi=(H(key) + di) MOD m,i=1,2,…,k(k<=m-1),其中H(key)为散列函数,m为散列表长,di为增量序列,可有下列三种取法
再散列法
链地址法
(1)JDK1.7用的是头插法,而JDK1.8及之后使用的都是尾插法,那么他们为什么要这样做呢?因为JDK1.7是用单链表进行的纵向延伸,当采用头插法时会容易出现逆序且环形链表死循环问题。但是在JDK1.8之后是因为加入了红黑树使用尾插法,能够避免出现逆序且链表死循环的问题。
(2)扩容后数据存储位置的计算方式也不一样:1. 在JDK1.7的时候是直接用hash值和需要扩容的二进制数进行&(这里就是为什么扩容的时候为啥一定必须是2的多少次幂的原因所在,因为如果只有2的n次幂的情况时最后一位二进制数才一定是1,这样能最大程度减少hash碰撞)(hash值 & length-1)
(3)JDK1.7的时候使用的是数组+ 单链表的数据结构。但是在JDK1.8及之后时,使用的是数组+链表+红黑树的数据结构(当链表的深度达到8的时候,也就是默认阈值,就会自动扩容把链表转成红黑树的数据结构来把时间复杂度从O(n)变成O(nlogN)提高了效率)
1. 继承关系
public class HashMap<K,V> extends AbstractMap<K,V>implements Map<K,V>, Cloneable, Serializable
HashMap继承AbstractMap
2.基本属性
HashMap底层的实现是数组+链表实现:数组中存储的是一个个entry实体,hash到同一个索引位置的数据通过链表链接起来;
transient Node[] table = (Entry[]) EMPTY_TABLE;
static class Entry{
final K key; //键值对的key
V value; //键值对的value
Entry next; //next节点
int hash; //和key相关的hash
}
transient Set> entrySet;
transient int size; //hashMap中存储entry实体的个数
transient int modCount; //版本号
int threshold; //扩容的阈值,即map的最大容量 capacity * loadFactor 容量*加载因子
final float loadFactor; //加载因子
3. 默认值
private static final long serialVersionUID = 362498820763181265L;
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //哈希表中数组默认初始容量为16
static final int MAXIMUM_CAPACITY = 1 << 30; //哈希表中数组的最大容量值
static final float DEFAULT_LOAD_FACTOR = 0.75f; //默认加载因子 ,用于扩容
static final Entry,?>[] EMPTY_TABLE = {}; //空数组
static final Entry[] table = (Entry[]) EMPTY_TABLE; //table初始化大小为2的指数次方
static final int TREEIFY_THRESHOLD = 8;
static final int UNTREEIFY_THRESHOLD = 6;
static final int MIN_TREEIFY_CAPACITY = 64;
4. 特点
5.构造函数
可以看出,数组并未在HashMap的构造函数中进行初始化
//指定初始容量、指定加载因子
public HashMap(int initialCapacity, float loadFactor) {
//基本的参数校验
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +loadFactor);
//加载因子、扩容阈值初始化
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
init();
}
//通过默认加载因子和默认容量初始化
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
//通过默认加载因子和指定容量初始化
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
//通过Map集合来初始化当前集合
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
6. HashMap常用方法
put(); //添加
int size(); //map中存储键值对的个数
boolean isEmpty(); //判断集合是否为空
boolean containsKey(); //判断键是否存在
boolean contiansValue(); //判断值是否存在
void putAll(Map<? extends K,); //将map集合添加至该集合中
void clear(); //清除集合
7. 数组增长方式
当size>=扩容阈值threshold时,数组进行扩容,新的数组长度为2*table.length
8. 增删方式
put()方法添加元素
public V put(K key, V value) {
//第一次插入元素,需要对数组进行初始化:注意:数组大小为2的指数关系
if (table == EMPTY_TABLE) {
inflateTable(threshold);
}
//可以存储key为null的情况
if (key == null)
return putForNullKey(value);
//key不为null
//通过key来哈希找到该数据所存在的索引位置:key相关的哈希值
int hash = hash(key);
int i = indexFor(hash, table.length);
//遍历该位置i下面的链表:(判断key是否存在,存在替换value,不存在创建新entry)
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);
return null;
}
private V putForNullKey(V value) {
for (Entry<K,V> e = table[0]; e != null; e = e.next) {
if (e.key == null) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(0, null, value, 0);
return null;
}
final int hash(Object k) {
int h = hashSeed;
if (0 != h && k instanceof String) {
return sun.misc.Hashing.stringHash32((String) k);
}
h ^= k.hashCode();
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}
static int indexFor(int h, int length) {
// assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
return h & (length-1);
}
void addEntry(int hash, K key, V value, int bucketIndex) {
newCapacity(table.length) *loadFactor
if ((size >= threshold) && (null != table[bucketIndex])) {
//扩容
resize(2 * table.length);
//更新新插入元素的索引位置
hash = (null != key) ? hash(key) : 0;
bucketIndex = indexFor(hash, table.length);
}
//不考虑扩容则调用createEntry()
createEntry(hash, key, value, bucketIndex);
}
//扩容函数
void resize(int newCapacity) {
Entry[] oldTable = table;
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
Entry[] newTable = new Entry[newCapacity];
transfer(newTable, initHashSeedAsNeeded(newCapacity));
table = newTable;
threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}
void transfer(Entry[] newTable, boolean rehash) {
int newCapacity = newTable.length;
for (Entry e : table) {
while(null != e) {
Entry next = e.next;
if (rehash) {
e.hash = null == e.key ? 0 : hash(e.key);
}
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
}
}
}
void createEntry(int hash, K key, V value, int bucketIndex) {
Entry e = table[bucketIndex];
table[bucketIndex] = new Entry<>(hash, key, value, e);
size++;
}
get()方法获取元素:
public V get(Object key) {
if (key == null)
return getForNullKey();
Entry<K,V> entry = getEntry(key);
return null == entry ? null : entry.getValue();
}
判断key是否为null,是则特殊处理,直接到0号索引位置查找元素
先通过hash找到索引位置,通过索引位置找到当前链表,通过判断key是否相等找到value进行返回
判断元素相等的条件:
e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k)))
其中:
e.hash == hash &&(k = e.key) == key
e.hash == hash &&(key != null && key.equals(k))
final Entry<K,V> getEntry(Object key) {
if (size == 0) {
return null;
}
int hash = (key == null) ? 0 : hash(key);
for (Entry<K,V> e = table[indexFor(hash, table.length)];
e != null;
e = e.next) {
Object k;
if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))
return e;
}
return null;
}
remove():删除元素
结合前面的put()和get()方法来看remove()方法就比较容易了
public V remove(Object key) {
Entry<K,V> e = removeEntryForKey(key);
return (e == null ? null : e.value);
}
final Entry<K,V> removeEntryForKey(Object key) {
if (size == 0) {
return null;
}
int hash = (key == null) ? 0 : hash(key);
int i = indexFor(hash, table.length);
Entry<K,V> prev = table[i];
Entry<K,V> e = prev;
while (e != null) {1
Entry<K,V> next = e.next;
Object k;
if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k)))) {
modCount++;
size--;
if (prev == e)
table[i] = next;
else
prev.next = next;
e.recordRemoval(this);
return e;
}
prev = e;
e = next;
}
return e;
}