集合进阶-HashSet、LinkedHashSet、TreeSet

Set系列集合

  • 无序:存取顺序不一致
  • 不重复:可以去除重复
  • 无索引:没有带索引的方法,所以不能使用普通for循环遍历,也不能通过索引获取元素

Set集合的实现类

HashSet:无序、无索引、不重复

LinkedHashSet:有序、不重复、无索引

TreeSet:可排序、不重复、无索引

Set系列集合没有特有的方法,直接继承顶层接口Collection中的所有方法并使用。

1.HashSet

HashSet底层:

  • HashSet集合底层采用哈希表存储数据
  • 哈希表是一种对于增删改查数据性能都比较好的结构

哈希表的组成:

  • JDK8之前:数组+链表
  • JDK8开始:数组+链表+红黑树

HashSet底层存储数据:

通过调用hashCode方法计算对象的哈希值,然后根据哈希值和数组长度计算出对象应存入哈希表的位置,然后该对象再调用equals方法和当前位置的所有对象依次比较,若存在相同属性值对象,则舍弃该对象不存,若不存在属性值相同对象,则将该对象存入当前位置。

注意:一定要重写hashCode和equals方法,这样才能保证实现不重复

哈希值细节:

  • 根据hashCode方法算出来的int类型的整数
  • 该方法定义在Object类中,所有对象都可以调用,默认使用地址值进行计算
  • 一般情况下,都会重写hashCode方法,利用对象内部的属性值计算哈希值
  • 如果没有重写hashCode方法,不同对象计算出来的哈希值是不同的
  • 如果重写了hashCode方法,不同对象只有属性值相同,计算出来的哈希值就是一样的
  • 小部分情况下,不同属性值或者不同地址值计算出来的哈希值也有可能一样。(哈希碰撞)

HashSet底层原理:

  1. 创建一个默认长度16,默认加载因子0.75的数组,数组名table
  2. 根据元素的哈希值跟数组的长度计算出应存入的位置
  3. 判断当前位置是否为null,如果是null直接存入
  4. 如果位置不为null,表示当前位置已经有元素,则调用equals方法比较属性值
  5. 一样:表明重复了,不存 ;不一样:存入数组,形成链表(JDK8以前:新元素存入数组,老元素挂在新元素下面;JKD8开始:新元素直接挂在老元素下面)
  6. 当元素个数达到16*0.75=12个时,数组会扩容为原来的2倍长度变成32

JDK8以后,当链表长度超过8且数组长度大于等于64时,自动转换为红黑树

如果集合中存储的是自定义对象,必须重写hashCodeequals方法

三个问题:

HashSet为什么存和取的顺序不一样?

HashSet为什么没有索引?

HashSet是利用什么机制保证数据去重的?

2.LinkedHashSet

  • 有序、不重复、无索引
  • 有序指的是存储和取出元素的顺序一致
  • 原理:底层数据结构依然是哈希表,只是每个元素又额外多了一个双链表的机制记录存储的顺序

总结:

1.LinkedHashSet集合的特点和原理是怎样的?

  • 有序、不重复、无索引
  • 底层基于哈希表,使用双链表记录添加顺序

2.以后如果要数据去重,我们应该使用哪个?

  • 默认使用HashSet,因为HashSet的效率更高
  • 如果要求去重且存取有序,才使用LinkedHashSet

3.TreeSet

TreeSet的特点:

  • 不重复、无索引、可排序
  • 可排序:按照元素的默认规则(由小到大)排序
  • TreeSet集合底层是基于红黑树的数据结构实现排序的,增删改查性能都比较好

TreeSet集合默认规则

  • 对于数值类型:Integer,Double,默认是按照从小到大的顺序进行排序
  • 对于字符、字符串类型:按照字符在ASCII码表中的数字升序进行排序
public class TreeSetDemo1 {
    public static void main(String[] args) {
        //创建TreeSet集合对象
        TreeSet ts = new TreeSet<>();
        //添加元素
        ts.add(5);
        ts.add(3);
        ts.add(1);
        ts.add(4);
        ts.add(2);

        //打印集合
        System.out.println(ts);//[1, 2, 3, 4, 5]

        //三种通用遍历方式遍历
        //迭代器遍历
        /*Iterator it = ts.iterator();
        while (it.hasNext()){
            int i = it.next();
            System.out.println(i);
        }*/

        //增强for遍历
        /*for (Integer t : ts) {
            System.out.println(t);
        }*/

        //lambda表达式遍历
        ts.forEach(i-> System.out.println(i));
    }
}

TreeSet两种比较方式

方式一:

默认排序/自然排序:Javabean类实现Comparable接口指定比较规则

举例:学生有姓名、年龄属性,现要求按照学生的年龄进行排序,同年龄按照姓名字母排序

public class Student2 implements Comparable{
    //通过compareTo方法指定比较规则

    //this:表示当前要添加的元素
    //o:表示已经在红黑树中存在的元素

    //返回值:
    //正数:表示当前要添加的元素是大的,存右边
    //负数:表示当前要添加的元素是小的,存左边
    //0:表示当前要添加的元素已经存在,舍弃
    @Override
    public int compareTo(Student2 o) {
        //指定排序规则
        //按照年龄升序进行排列
        return this.getAge() - o.getAge();
    }
}
public class TreeSetDemo2 {
    public static void main(String[] args) {
        Student2 s1 = new Student2("zhangsan",23);
        Student2 s2 = new Student2("lisi",24);
        Student2 s3 = new Student2("wangwu",25);

        TreeSet ts = new TreeSet<>();

        ts.add(s1);
        ts.add(s2);
        ts.add(s3);

        System.out.println(ts);
    }
}

方式二:

比较器排序:创建TreeSet对象时,传递比较器Comparator指定规则

举例:存入字符串"b","ac","bc","abc",按照长度排序,如果一样长则按照首字母排序

public class TreeSetDemo3 {
    public static void main(String[] args) {

        /*TreeSet ts = new TreeSet<>(new Comparator() {
            @Override
            public int compare(String o1, String o2) {
                int i = o1.length() - o2.length();
                i = i == 0 ? o1.compareTo(o2) : i;
                return i;
            }
        });*/

        //o1:表示当前要添加的元素
        //o2:表示在红黑树中已经存在的元素
        TreeSet ts = new TreeSet<>((o1,o2)->{
                //按照长度排序
                int i = o1.length() - o2.length();
                //如果长度一样按照首字母排序
                i = i == 0 ? o1.compareTo(o2) : i;
                return i;
        });

        ts.add("c");
        ts.add("ac");
        ts.add("bc");
        ts.add("abc");

        System.out.println(ts);
    }
}

使用原则:默认使用第一种,如果第一种不能满足当前需求,就使用第二种

总结:

1.如果想要集合中的元素可重复

  • 用ArrayList集合,基于数组的。(用的最多)

2.如果想要集合中的元素可重复,而且当前的增删操作明显多于查询

  • 用LinkedList集合,基于链表的

3.如果想对集合中的元素去重

  • 用HashSet集合,基于哈希表的。(用的最多)

4.如果想对集合中的元素去重,而且保证存取有序

  • 用LinkedHashSet集合,基于哈希表和双链表,效率低于HashSet

5.如果想对集合中的元素进行排序

  • 用TreeSet集合,基于红黑树。后续也可以用List集合实现排序

你可能感兴趣的:(集合,Java基础,数据结构,java,后端)