HashMap

一、哈希表

哈希表:也叫散列表,是根据关键码值而直接进行访问的数据结构,即它通过把关键码值来映射到表的一个位置来访问记录,以加快查找速度,这个映射函数叫哈希函数;
HashMap_第1张图片
图片来自网络

  1. 哈希函数:键与值映射的一个映射关系

常用的哈希函数 :

  • 直接寻址法: 取关键字或关键字的某个线性函数为地址
    • f(x) = kx + b  (k、b为常数)
  • 除留余数法: 取关键字被某个不大于哈希表长度m的数k除后所得余数为地址
    • f(x) = x%k (k <= m)  [m为存储位置长度]
  • 平方取中法: 当无法确定关键字中哪几位分布较均匀时,可以先求出关键字的平方值,然后按需要取平方值的中间几位作为哈希地址;因为平方后中间几位和关键字中每一位都相关,故不同关键字会以较高的概率产生不同的哈希地址;
  • 折叠法:将关键字分割成位数相同的几部分,最后一部分位数可以不同,然后取这几部分的叠加和(去除进位)作为地址
    • 数位叠加可以有移位叠加和间接叠加两种方法:
      • 移位叠加是将分割后的每一部分的最低位对齐,然后相加;
      • 间界叠加是从一端向另一端沿分割界来回折叠,然后对齐相加;
  • 随机数法:选择一随机函数,取关键字的随机值作为散列地址,通常用于关键字长度不同的场合;
  1. 哈希冲突:m != n 但是 f(m) == f(n)

解决哈希冲突的方法:

  • 开放寻址法:Hi=(H(key) + di) MOD m,i=1,2,…,k(k<=m-1),其中H(key)为散列函数,m为散列表长,di为增量序列,可有下列三种取法

    • di=1,2,3,…,m-1,称线性探测再散列;
    • di=12,-12,22,-22,⑶2,…,±(k)2,(k<=m/2)称二次探测再散列;
    • di=伪随机数序列,称伪随机探测再散列
  • 再散列法

  • 链地址法

二、HashMap在JDK1.7和JDK1.8的区别???

(1)JDK1.7用的是头插法,而JDK1.8及之后使用的都是尾插法,那么他们为什么要这样做呢?因为JDK1.7是用单链表进行的纵向延伸,当采用头插法时会容易出现逆序且环形链表死循环问题。但是在JDK1.8之后是因为加入了红黑树使用尾插法,能够避免出现逆序且链表死循环的问题。
(2)扩容后数据存储位置的计算方式也不一样:1. 在JDK1.7的时候是直接用hash值和需要扩容的二进制数进行&(这里就是为什么扩容的时候为啥一定必须是2的多少次幂的原因所在,因为如果只有2的n次幂的情况时最后一位二进制数才一定是1,这样能最大程度减少hash碰撞)(hash值 & length-1)
(3)JDK1.7的时候使用的是数组+ 单链表的数据结构。但是在JDK1.8及之后时,使用的是数组+链表+红黑树的数据结构(当链表的深度达到8的时候,也就是默认阈值,就会自动扩容把链表转成红黑树的数据结构来把时间复杂度从O(n)变成O(nlogN)提高了效率)

三、HashMap(JDK1.7)

1. 继承关系

 public class HashMap<K,V> extends AbstractMap<K,V>implements Map<K,V>, Cloneable, Serializable

HashMap继承AbstractMap类(jdk 1.2之后),实现Map接口,Cloneable和 Serializable接口,可以克隆,也可以序列化;

2.基本属性

HashMap底层的实现是数组+链表实现:数组中存储的是一个个entry实体,hash到同一个索引位置的数据通过链表链接起来;

transient Node[] table = (Entry[]) EMPTY_TABLE;

static class Entry{
   final K key; //键值对的key
   V value;   //键值对的value
   Entry next;  //next节点
   int hash;  //和key相关的hash
}

transient Set> entrySet;
transient int size; //hashMap中存储entry实体的个数
transient int modCount; //版本号
int threshold; //扩容的阈值,即map的最大容量  capacity * loadFactor 容量*加载因子
final float loadFactor; //加载因子

3. 默认值

private static final long serialVersionUID = 362498820763181265L;
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //哈希表中数组默认初始容量为16
static final int MAXIMUM_CAPACITY = 1 << 30; //哈希表中数组的最大容量值
static final float DEFAULT_LOAD_FACTOR = 0.75f; //默认加载因子 ,用于扩容
static final Entry[] EMPTY_TABLE = {}; //空数组


static final Entry[] table = (Entry[]) EMPTY_TABLE; //table初始化大小为2的指数次方
static final int TREEIFY_THRESHOLD = 8;
static final int UNTREEIFY_THRESHOLD = 6;
static final int MIN_TREEIFY_CAPACITY = 64;

4. 特点

  • HashMap底层采用数组+链表存储key-value键值对,数组的默认容量为16;
  • 扩容时定义一个新的数组,长度为2*table.length,再将原来的元素进行重哈希存入新的数组中;
  • 根据其存储的元素又有以下特点:
    • 键可以为null,值也可以为null;
    • 键不能重复,值可以重复;
    • 不能保证插入有序;

5.构造函数

可以看出,数组并未在HashMap的构造函数中进行初始化

//指定初始容量、指定加载因子
public HashMap(int initialCapacity, float loadFactor) {
    //基本的参数校验
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +loadFactor);
    //加载因子、扩容阈值初始化
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
    init();
}
//通过默认加载因子和默认容量初始化
public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
//通过默认加载因子和指定容量初始化
public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
//通过Map集合来初始化当前集合
public HashMap(Map<? extends K, ? extends V> m) {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    putMapEntries(m, false);
}

6. HashMap常用方法

	put(); //添加
    int size(); //map中存储键值对的个数
    boolean isEmpty(); //判断集合是否为空
    boolean containsKey(); //判断键是否存在
    boolean contiansValue(); //判断值是否存在
    void putAll(Map<? extends K,); //将map集合添加至该集合中 
    void clear(); //清除集合

7. 数组增长方式

当size>=扩容阈值threshold时,数组进行扩容,新的数组长度为2*table.length
HashMap_第2张图片
8. 增删方式

put()方法添加元素

public V put(K key, V value) {
     //第一次插入元素,需要对数组进行初始化:注意:数组大小为2的指数关系
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    //可以存储key为null的情况
    if (key == null)
        return putForNullKey(value);
        
    //key不为null 
    //通过key来哈希找到该数据所存在的索引位置:key相关的哈希值   
    int hash = hash(key);
    int i = indexFor(hash, table.length);
    //遍历该位置i下面的链表:(判断key是否存在,存在替换value,不存在创建新entry)
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    modCount++;
    addEntry(hash, key, value, i);
    return null;
} 
  • 插入key为null情况
    • key为null做特殊处理,存储在table[0]号索引位置;
    • 遍历该位置下的链表,查看key为null的节点是否存在,存在即将value更新为传入的value;
    • 若该链表下不存在则创建新的entry节点插入该链表(调用addEntry());
private V putForNullKey(V value) {
    for (Entry<K,V> e = table[0]; e != null; e = e.next) {
        if (e.key == null) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    addEntry(0, null, value, 0);
    return null;
} 
  • 插入key不为null的情况
    • 通过key来哈希得到对应存储位置;
    • 遍历该位置下的链表,查看key为null的节点是否存在,存在即将value更新为传入的value;
    • 若该链表下不存在则创建新的entry节点插入该链表(调用addEntry());
    final int hash(Object k) {
        int h = hashSeed;
        if (0 != h && k instanceof String) {
            return sun.misc.Hashing.stringHash32((String) k);
        }
        h ^= k.hashCode();
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }
static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }     
  • 扩容时机:当前存储元素的个数size>=扩容阈值threshold时考虑扩容
  • 扩容大小为2倍的数组大小table.length(数组要满足2的指数级关系)
void addEntry(int hash, K key, V value, int bucketIndex) {
     newCapacity(table.length) *loadFactor
    if ((size >= threshold) && (null != table[bucketIndex])) {
        //扩容
        resize(2 * table.length);
        
        //更新新插入元素的索引位置
        hash = (null != key) ? hash(key) : 0;
        bucketIndex = indexFor(hash, table.length);
    }

	//不考虑扩容则调用createEntry()
    createEntry(hash, key, value, bucketIndex);
}
//扩容函数
void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
    if (oldCapacity == MAXIMUM_CAPACITY) {
        threshold = Integer.MAX_VALUE;
        return;
    }

    Entry[] newTable = new Entry[newCapacity];
    transfer(newTable, initHashSeedAsNeeded(newCapacity));
    table = newTable;
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}
  • 创建新的table数组,并且将原来集合上的元素全部进行hash,找到新的对应位置进行插入
void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry e : table) {
        while(null != e) {
            Entry next = e.next;
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity);
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}
  • 添加结点:将元素作为当前索引位置的头部元素进行插入
void createEntry(int hash, K key, V value, int bucketIndex) {
    Entry e = table[bucketIndex];
    table[bucketIndex] = new Entry<>(hash, key, value, e);
    size++;
}    

get()方法获取元素:

  • 通过键值key来查找value
public V get(Object key) {
    if (key == null)
        return getForNullKey();
    Entry<K,V> entry = getEntry(key);
    return null == entry ? null : entry.getValue();
}
  • 判断key是否为null,是则特殊处理,直接到0号索引位置查找元素

  • 先通过hash找到索引位置,通过索引位置找到当前链表,通过判断key是否相等找到value进行返回

  • 判断元素相等的条件:

e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k)))

其中:

  • hash值相等且e.key==key 为当key为null时的判断条件;
e.hash == hash &&(k = e.key) == key 
  • 当key不为null时,判断条件为hash值相等,然后用.equals方法判断key值相等;
e.hash == hash &&(key != null && key.equals(k))
final Entry<K,V> getEntry(Object key) {
    if (size == 0) {
        return null;
    }
    int hash = (key == null) ? 0 : hash(key);
    for (Entry<K,V> e = table[indexFor(hash, table.length)];
         e != null;
         e = e.next) {
        Object k;
        if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))
            return e;
    }
    return null;
}

remove():删除元素

结合前面的put()和get()方法来看remove()方法就比较容易了

public V remove(Object key) {
    Entry<K,V> e = removeEntryForKey(key);
    return (e == null ? null : e.value);
}
final Entry<K,V> removeEntryForKey(Object key) {
    if (size == 0) {
        return null;
    }
    int hash = (key == null) ? 0 : hash(key);
    int i = indexFor(hash, table.length);
    Entry<K,V> prev = table[i];
    Entry<K,V> e = prev;

    while (e != null) {1   
        Entry<K,V> next = e.next;
        Object k;
        if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k)))) {
            modCount++;
            size--;
            if (prev == e)
                table[i] = next;
            else
                prev.next = next;
            e.recordRemoval(this);
            return e;
        }
        prev = e;
        e = next;
    }
    return e;
}   

你可能感兴趣的:(Java集合框架库)