Java-集合-HashSet-(2)源码分析

HashSet

可以直接看HashMap

1. 底层实现

HashSet的底层实现是HashMap

Set不能有重复的元素,HashMap不允许有重复的键

  • Set中有且只有1个元素的值为null

  • HashMap中,null可以作为键,这样的键只有一个;可以有一个或多个键所对应的值为null。

在HashSet中

  • 元素都存到HashMap键值对的Key上面,
  • Value是有一个统一的值private static final Object PRESENT = new Object();
    • 定义一个虚拟的Object对象作为HashMap的value,将此对象定义为static final。

2. 源码分析

public class HashSet
    extends AbstractSet
    implements Set, Cloneable, java.io.Serializable
{
    static final long serialVersionUID = -5024744406713321676L;
    private transient HashMap map;    // 底层使用HashMap来保存HashSet中所有元素。  
    private static final Object PRESENT = new Object();// 定义一个虚拟的Object对象作为HashMap的value,将此对象定义为static final。  

    //实际底层会初始化一个空的HashMap,并使用默认初始容量为16和加载因子0.75。
    public HashSet() { 
        map = new HashMap<>();
    }

    public HashSet(Collection c) {
        map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
        addAll(c);
    }

    public HashSet(int initialCapacity, float loadFactor) {
        map = new HashMap<>(initialCapacity, loadFactor);
    }

    public HashSet(int initialCapacity) {
        map = new HashMap<>(initialCapacity);
    }

    HashSet(int initialCapacity, float loadFactor, boolean dummy) {
        map = new LinkedHashMap<>(initialCapacity, loadFactor);
    }

    public Iterator iterator() {
        return map.keySet().iterator();
    }

    public int size() {
        return map.size();
    }

    public boolean isEmpty() {
        return map.isEmpty();
    }

    public boolean contains(Object o) {
        return map.containsKey(o);
    }

    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

    public boolean remove(Object o) {
        return map.remove(o)==PRESENT;
    }

    public void clear() {
        map.clear();
    }
......
}

3. HashSet的插入与删除

插入:

    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

当有新值加入时,底层的HashMap会判断Key值是否存在(HashMap细节请移步深入理解HashMap)

  • 如果不存在,则插入新值,同时这个插入的细节会依照HashMap插入细节
  • 如果存在就不插入

删除

    public boolean remove(Object o) {  
    return map.remove(o)==PRESENT;  
    }  

同HashMap删除原理:底层实际调用HashMap的remove方法删除指定Entry。

  • 如果存在于此set中,则需要将其移除的对象,并返回true
  • 如果不存在,返回false

【问题1】既然hashset基于hashmap实现,你说一下 hashset的add方法中,为什么要在map.put的val上放上一个object类型的静态常量present?

首先要看hashmap的put 方法的返回值,map对象在调用put的时候传入一个key和val,会对其key进行一个算法得到一个位置,会把put的数据放到其位置上,如果该位置上已经存在当前key,会对其key映射的val给替换掉,并且返回之前的val,否则返回null。
好了,既然put的返回值原理搞清楚了,就要去看看 set 的add方法的实现,add方法是调用了put方法,并且把key放在了put的key上,val放了一个hashset类的静态常量present, 如果put 返回的是null,不是present,就说明 put的key是不存在的,add也会返回true,如果put返回的是present就说明之前的key是存在的,并不是说没有put上,所以add方法返回的false并不是存失败的意思,而是map.put的key是已经存在的,而且已经把val给替换了。

【问题2】既然hashset基于hashmap实现,你说一下 hashset的remove方法中,为什么要在map.remove key 完了之后要和present进行一个等值比较呢?

首先要看hashmap的remove的返回原因,hashmap的remove方法删除一个key的时候会把之前的val的返回出来,这点弄清楚。
就要明白为什么set在remove的时候要和present进行对比,如果map中remove的返回是present,说明key是存在的,返回true,这点要结合set的add进行一个联想,如果返回的不是present,说明这个key在set对象里面的hashmap中是不存在的,所以返回的是false。

注意

  • 说白了,HashSet就是限制了功能的HashMap,所以了解HashMap的实现原理,这个HashSet自然就通
  • 对于HashSet中保存的对象,主要要正确重写equals方法和hashCode方法,以保证放入Set对象的唯一性
  • 虽说是Set是对于重复的元素不放入,倒不如直接说是底层的Map直接把原值替代了(这个Set的put方法的返回值真有意思)
  • HashSet没有提供get()方法,原因是同HashMap一样,Set内部是无序的,只能通过迭代的方式获得

Java-集合-HashSet-(1)不重复原理

你可能感兴趣的:(Java-集合-HashSet-(2)源码分析)