关于HashMap 的底层原理,看这一篇就够了,总结的清新脱俗!

前言:

关于java基础,在hashMap底层原理这个问题上可以说是非常经典的问题了;下面就讨论下hashMap的底层原理;
另外个人整理了一些资料,有需要的朋友可以直接点击领取。

Java基础知识大全

22本Java架构师核心书籍

从0到1Java学习路线和资料

1000+道2021年最新面试题

JDK1.7 HashMap的底层源码:

HashMap 的存储结构:

 HashMap的存储结构是数组+链表的结合(在jdk1.8之后,添加了红黑树结构(具体看下面jdk1.8介绍))
 ,当实例化一个HashMap时,系统会建立一个长度为capacity的entry数组,在这个数组中可以存
储元素的位置,我们称为“桶”(bucket),;每个bucket都有自己的索引,系统可以通过索引快速的
查到到bucket中的元素;(底层通过hash算法,把元素存储到对应的索引中的bucket中,如果有多的就存储到
对应的链表中)每个bucket中都带有一个引用变量用来指向下一个元素(链表了);因此,在一个bucket中
就生成了一条entry链;entry是hashMap中的基本组成单元,每个entry包含了一哥key-value键值对;
entry是HashMap中的一个静态内部类(初始化);

static class Entry implements Map.Entry{
   final K key;
   V value;
   Entry next; // 存储指向下一个entry的引用,单链表结构;
   int hash; // 对key的hashcod值进行hash运算的得到的值,存储在entry中,避免重复运算
   /**
   * create  new entry
   */
   Entry(int h,K K,V v,Entry n){
     value=v;
     next=n;
     key = k;
     hash=h;
   }
}

而jdk1.8之后为Node(除了给hash值加了final修饰外,表示不可变之外没有什么变化):

static class Node implements Map.Entry{
   final int hash;
   final K key;
   V value;
   Node next;
   Node(int hash,K key,V value,Node next){
       this.hash=hash;
       this.key=key;
       this.value=value;
       this.next=next;
   }
}

经过以上分析,hashMap的存储结构可以用下图来表示:



元素中hash值的算法为:key的hash值%len(数组/桶 的长度);

构造方法:

先看下hashMap中的几个重要的属性

//1<<4=2的4次方 默认的初始容量为16;
static final int Default_INITIAL_CAPACITY=1<<4;
// 最大容量为2的30次方
static final int MAXIMUM_CAPACITY=1>>30;
// 默认的装载因子
static final float DEFUALT_LOAD_FACTOR=0.75F;
// HashMap内部的存储结构为一个数组,此处的数组为空,即没有初始化之前的状态
static final Entry[] EMPTY_TABLE={};
// (向下转型)空的存储实体 transient表示不需要序列化的属性
transient Entry[] table=(Entry)EMPTY_TABLE;
// 实际存储key-value键值对的个数
transient int size;
// 阈值,当table=={} 值,该值为初始容量(16);当table被填充时,threshold的值为capacity*loadFactor;hashMap在进行扩容时需要参照threshold;
int threshold;
// 负载因子,代表了table的填充度有多少,默认的值为0.75
final float loadFactor;
// 快速失败(由于hashMap是线程非安全性的,所以在hashMap参与迭代的过程中,如果出现了其他线程参与而导致hashMap的结果发生了改变(如,put,remove操作),需要抛出ConcurrentModifactionException异常)
transient int modCount;
// 默认的threshold的值; 
 // Integer类中 @Native public static final int   MAX_VALUE = 0x7fffffff; integer最大取值方位21亿
static final int ALTERNATIVE_HASHING_THRESHOLD_DEFUALT=Integer.MAX_VALUE;
//计算hash值时的key
transient int hashSeed=0;


jdk1.8之后:(jdk1.8之后添加了红黑树,当超过8时,转化为红黑树,当到6时,换为数组+链表的结构;中间7为缓冲)

 private static final long serialVersionUID = 362498820763181265L;
    /**
     * The default initial capacity - MUST be a power of two.
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

    /**
     * The maximum capacity, used if a higher value is implicitly specified
     * by either of the constructors with arguments.
     * MUST be a power of two <= 1<<30.
     */
    static final int MAXIMUM_CAPACITY = 1 << 30;

    /**
     * The load factor used when none specified in constructor.
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    /**
     * The bin count threshold for using a tree rather than list for a
     * bin.  Bins are converted to trees when adding an element to a
     * bin with at least this many nodes. The value must be greater
     * than 2 and should be at least 8 to mesh with assumptions in
     * tree removal about conversion back to plain bins upon
     * shrinkage.
     * 当链表的数组长度为8时,转化为红黑树
     */
    static final int TREEIFY_THRESHOLD = 8;

    /**
     * The bin count threshold for untreeifying a (split) bin during a
     * resize operation. Should be less than TREEIFY_THRESHOLD, and at
     * most 6 to mesh with shrinkage detection under removal.
     * 数组长度为6时,又转换回来
     */
    static final int UNTREEIFY_THRESHOLD = 6;

    /**
     * The smallest table capacity for which bins may be treeified.
     * (Otherwise the table is resized if too many nodes in a bin.)
     * Should be at least 4 * TREEIFY_THRESHOLD to avoid conflicts
     * between resizing and treeification thresholds.
     * 最小树形化阈值:当hash表中的容量>64时,链表才会转化为红黑树
     * 如果桶中的数量过大,不是为树形化(转为红黑树),而是要进行扩容
     * 为了避免扩容,树形化的选择冲突,这个值不能小于4*TREEINF_THRESHOLD
     */
    static final int MIN_TREEIFY_CAPACITY = 64;

    transient Node[] table;

    /**
     * Holds cached entrySet(). Note that AbstractMap fields are used
     * for keySet() and values().
     */
    transient Set> entrySet;

    /**
     * The number of key-value mappings contained in this map.
     */
    transient int size;

    transient int modCount;

    int threshold;

    final float loadFactor;


HashMap 有4个构造器(如果构造器没有自带参数,那么会使用默认的16初始容量和0.75的加载因子)

//通过初始容量和状态因子来构造HashMap
public HashMap(int initialCapacity,float loadFactor){
   //参数有效性的检查
   if(initialCapacity<0){
    throw new IllegalArgumentException("Illegal initial Argument" +initialCapacity);
}
 if(initialCapacity>MAXIMUM_CAPACITY) 
  initialCapacity=MAXIMUM_CAPACITY;
  if(loadFactor<=0 || Float.isNaN(loadFactor)){
  threw new IllegalArgumentException("Illegal loadFactory Aragument"+loadFactor);
  }
  this.loadFactory=loadFactory;
  threshold=initialCapacity;
  init(); // 在hashMap中没有具体的实现,不过在其子类linkedHashMap中就会有对应的实现
}
// 通过扩容因子来构造HashMap,容量默认值16
public HashMap(int initialCapacity ){
   this(initialCapacity,Default_LOAD_FACTOR);
}
// 无参构造函数
public HashMap(){
this(DEFAULT_INITIALCAPACITY,DEFAULT_LOAD_FACTORY);
//通过其他Map来初始化HashMap,容量通过Map中的size来计算,转载因子为0.75
public HashMap(Map m){
  this(Math.max((int) (m.size()/DEFAULT_LOAD_FACTOR)+1,DEFAULT_INITAL_CAPACITY),DEFAULT_LOAD_FACTOR);
  //初始化HashMap的底层数组结构
  inflateTable(threshold);
  // 添加m中的元素
  putAllForCreate(m);
}
}

你可能感兴趣的:(关于HashMap 的底层原理,看这一篇就够了,总结的清新脱俗!)