Java容器源码分析——HashSet是如何保证元素的不可重复

一、前言

HashSet的基本特点是元素不可重复,但是不能保证元素的顺序;同时也是不同步的,所以多线程常见会存在线程安全问题。在开发过程中,HashSet是一个不错的去重工具。那是具体的实现机制是怎样的呢?马上开始揭晓。

二、源码解读

特性

HashSet继承了集合框架AbstractSet,保证了集合的基本特征,实现了接口Set包含了基本集合操作,实现了接口Cloneable支持克隆,实现了Serializable支持序列化。

public class HashSet
    extends AbstractSet
    implements Set, Cloneable, java.io.Serializable

变量 

  //Set的实现原理
  private transient HashMap map;

  //集合中元素的映射值,不可变,所以所有元素的都是映射值相同
  private static final Object PRESENT = new Object();

构造方法 

五个构造方法,前四个都是用力构建单纯哈希表,最后一个仅是构造函数由LinkedHashSet使用

    //无参构造函数HashSet的实现机制就是HashMap
    public HashSet() {
        map = new HashMap<>();
    }
    //构造包含指定元素集合的set,map的初始化容量:最小为16,最大等于加入集合大小的除0.75+1
    //然后加集合加入到map中
    public HashSet(Collection c) {
        map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
        addAll(c);
    }
    //构造一个指定大小和负载系数的Set集合(map)
    public HashSet(int initialCapacity, float loadFactor) {
        map = new HashMap<>(initialCapacity, loadFactor);
    }
    //构造一个指定大小Set,无负载系统
    public HashSet(int initialCapacity) {
        map = new HashMap<>(initialCapacity);
    }
    //构造函数仅由LinkedHashSet使用
    HashSet(int initialCapacity, float loadFactor, boolean dummy) {
        map = new LinkedHashMap<>(initialCapacity, loadFactor);
    }   

主要方法 

从下面的方法中,可以看出对Set集合操作实际上是对HashMap的操作,只是key不同,value相同。

    //迭代 
    public Iterator iterator() {
         return map.keySet().iterator();
    }
    //集合大小
    public int size() {
         return map.size();
    }
    //判断集合是否为空
    public boolean isEmpty() {
        return map.isEmpty();
    }
    //集合是否包含某元素
    public boolean contains(Object o) {
        return map.containsKey(o);
    }
    //添加元素,实际只是添加key,value只是没有含义的对象
    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }
    //删除元素,实际是更加key删除元素
    public boolean remove(Object o) {
         return map.remove(o)==PRESENT;
    }
    //清除元素
    public void clear() {
         map.clear();
    }
    //1.8新增的方法并行迭代
    public Spliterator spliterator() {
        return new HashMap.KeySpliterator(map, 0, -1, 0, 0);
    }

 HashSet是如何实现元素不可重复的

通过源码已知,Hash本质上就是HashMap,HashSet的元素实际上就是HashMap的key。最终要探究的其实是HashMap中的key为什么不能重复? 在通过查询HashMap中的put的方法可以发现,在put元素时首先会计算key的hash值,通过hasn值来判断元素加入的位置,同时会与已存在元素的hash比较,如果相等,继续通过equas()比较hash值相同的两个对象是否真的相同,如果仍然相同则不允许插入。

三、总结

HashSet的特点:

  • 元素不可重复且无序,元素可为null
  • 非同步,不能线程安全
  • 实现机制是HashMap

备注:JDK版本:1.8.0_241

 

你可能感兴趣的:(Java源码分析,java)