Set继承于Collection接口,但是Set接口并不像List接口那样对Collection接口进行了大量的扩充,而是简单的继承了Collection接口。也就是说,Set里面并没有提供使用get()方法根据索引取得保存数据的操作。Set主要的实现类有:
在判断重复元素的时候,Set集合会调用hashCode()和equal()方法来实现。
此类实现 Set 接口,由哈希表(实际上是一个 HashMap 实例)支持。 它不保证 set 的迭代顺序;特别是它不保证该顺序恒久不变。 此类允许使用 null 元素。
特点:
不能保证元素的排列顺序,顺序有可能发生变化
不是同步的
集合元素可以是null,但只能放入一个null
构造方法
HashSet()
构造一个新的空集合; 背景HashMap实例具有默认初始容量(16)和负载因子(0.75)。
HashSet(Collection extends E> c)
构造一个包含指定集合中的元素的新集合。
HashSet(int initialCapacity)
构造一个新的空集合; 背景HashMap实例具有指定的初始容量和默认负载因子(0.75)。
HashSet(int initialCapacity, float loadFactor)
构造一个新的空集合; 背景HashMap实例具有指定的初始容量和指定的负载因子。
初始容量 就是创建时默认的容量
负载因子 是对其容量自动增加之前可以达到多满的一个尺度。
也就是说,HashSet()默认实例化时的初始容量是16,当元素达到16*0.75=12时,它就会自动增加。
HashSet元素的唯一性与无序性
HashSet 底层数据结构是哈希表,元素无序,且唯一。
import java.util.HashSet;
public class TestDefaultLength {
public static void main(String[] args) {
//hashset的唯一性和无序性
HashSet<String> hashSet = new HashSet<>();
//初始容量是16,加载因子是0.75
hashSet.add("张三");
hashSet.add("张三");
hashSet.add("李四");
hashSet.add("李四");
hashSet.add("王五");
hashSet.add("王五");
for (String s : hashSet) {
System.out.println(s);
}
}
}
// 运行后在控制台输出
李四
张三
王五
// 分析:
// 1. 唯一性:我们存了6个元素,有一半的重复元素,但是真正存进去的只有三个元素
// 2. 无序性:遍历这三个元素,显示它是随机输出的,既没有先进先出,也没有先进后出
// 3. 我们存入的类型都是String类型,之所以保证了唯一性是因为String类重写了hashCode()和equals()方法。
哈希表HashTable:
是一个元素为链表的数组,综合了数组和链表的优点 (像新华字典一样) (JDK1.7之前)(JDK1.8 数组+链表+红黑树)
当向 HashSet 集合中存入一个元素时,HashSet 会调用该对象的 hashCode() 方法来得到该对象的 hashCode 值,然后根据 hashCode 值决定该对象在 HashSet 中的存储位置。
HashSet 集合判断两个元素相等的标准:
取得哈希码,调hashCode()方法,先判断对象的hash码是否相同,依靠hash码取得一个对象的内容。再调用equals()方法,将对象的属性依次比较。
Hash算法:
一般称为散列,无序。利用二进制的计算结果来设置保存的空间,计算结果不同,最终保存空间的位置也不同,用hash算法保存的集合都是无序的,但是查找速度快。
结论:
HashSet 保证元素唯一性是靠元素重写hashCode()和equals()方法来保证的,如果不重写则无法保证。上面我们举的例子,往hashSet里添加的元素都是String类型,而String类型重写了hashCode()和equals()方法,所以保证了元素的唯一性。
HashSet存储自定义对象保证元素唯一性
按照上面的思路,如果我们要在hashSet里面存放自定义对象同时保证唯一性,那么我们也要重写hashCode()和equals()方法这两个方法。这两个方法你可以自己来写,要尽可能的保证能够判断出两个对象是否相同。一般我们利用工具直接生成。
import java.util.Objects;
public class Student {
private String name;
private int age;
public Student() {
}
public Student(String name, int age) {
this.name = name;
this.age = age;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public String toString() {
return "Student{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}
// 重写hashCode和equals方法保证用HashSet存储该类对象的唯一性
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
return age == student.age &&
Objects.equals(name, student.name);
}
@Override
public int hashCode() {
return Objects.hash(name, age);
}
}
import java.util.HashSet;
public class Test {
public static void main(String[] args) {
HashSet<Student> students = new HashSet();
students.add(new Student("张三", 19));
students.add(new Student("张三", 19));
students.add(new Student("李四", 19));
students.add(new Student("李四", 19));
students.add(new Student("王五", 19));
students.add(new Student("王五", 19));
for (Student student : students) {
System.out.println(student.toString());
}
}
}
// 运行结果:
Student{name='王五',age=19}
Student{name='张三',age=19}
Student{name='李四',age=19}
HashSet几种用法
来看几种HashSet几种比较有意思的用法:
HashSet的有参构造要求传入一个集合类对象,那么HashSet就会创造一个新集合,我们已经知道了HashSet存储元素的特点是无序且唯一,那么就可以用这个特点来去重。
import java.util.ArrayList;
import java.util.HashSet;
import java.util.Iterator;
public class AnotherConstrustor {
public static void main(String[] args) {
ArrayList<String> list = new ArrayList<>();
list.add("一一一");
list.add("二二二");
list.add("三三三");
list.add("一一一");
list.add("二二二");
list.add("三三三");
HashSet<String> hashSet = new HashSet<>(list);
//遍历输出一下
Iterator iterator = hashSet.iterator();
while (iterator.hasNext()){
System.out.println(iterator.next());
}
}
}
比如说我现在有一个字符串"abc?123#$xyz%acz",我要得到所有重复字符的索引,就可以new一个HashSet对象,利用add()方法的返回值作为判断条件来获取重复字符的索引:
import java.util.HashSet;
public class UseConstructor {
public static void main(String[] args) {
char[] chars = "abc?123#$xyz%acz".toCharArray();
String indexOfRepeat = getIndexOfRepeat(chars);
System.out.println(indexOfRepeat);
}
public static String getIndexOfRepeat(char[] chars) {
// 新建一个HashSet来保存字符
HashSet<Character> hashSet = new HashSet<>();
String result = "查询结果:";
if (chars != null) {
// 遍历字符数组,添加到hashSet
for (int i = 0; i < chars.length; i++) {
// hashSet不会把重复字符保存进去
//如果add方法返回false,就说明是重复元素
if (!hashSet.add(chars[i])) {
result += "\n重复的元素是:" + chars[i] + "\t索引是:" + i;
}
}
} else {
result = "字符数组为null";
}
return result;
}
}
//程序执行结果:
查询结果:
重复的元素是:a 索引是:13
重复的元素是:c 索引是:14
重复的元素是:z 索引是:15
LinkedHashSet集合同样是根据元素的hashCode值来决定元素的存储位置,但是它同时使用链表维护元素的次序。这样使得元素看起 来像是以插入顺序保存的,也就是说,当遍历该集合时候,LinkedHashSet将会以元素的添加顺序访问集合的元素。
LinkedHashSet在迭代访问Set中的全部元素时,性能比HashSet好,但是插入时性能稍微逊色于HashSet。
构造方法与HashSet类似:
LinkedHashSet()
构造一个具有默认初始容量(16)和负载因子(0.75)的新的,空的链接散列集。
LinkedHashSet(Collection extends E> c)
构造与指定集合相同的元素的新的链接散列集。
LinkedHashSet(int initialCapacity)
构造一个具有指定初始容量和默认负载因子(0.75)的新的,空的链接散列集。
LinkedHashSet(int initialCapacity, float loadFactor)
构造具有指定的初始容量和负载因子的新的,空的链接散列集。
import java.util.Iterator;
import java.util.LinkedHashSet;
public class LinkedHashSetDemo {
public static void main(String[] args) {
LinkedHashSet<Integer> linkedHashSet = new LinkedHashSet<>();
linkedHashSet.add(1);
linkedHashSet.add(1);
linkedHashSet.add(2);
linkedHashSet.add(2);
linkedHashSet.add(3);
linkedHashSet.add(3);
Iterator<Integer> iterator = linkedHashSet.iterator();
while (iterator.hasNext()){
System.out.println(iterator.next());
}
}
}
// 程序运行结果:
1
2
3
// 分析:
// 可见LinkedHashSet保存元素的特点是:元素有序 , 并且唯一
TreeSet是SortedSet接口的唯一实现类,TreeSet可以确保集合元素处于排序状态。TreeSet支持两种排序方式,自然排序和比较器排序,其中自然排序为默认的排序方式,即按照字母的升序排列数据。
具体情况取决于使用的构造方法。无参就是自然排序,否则就是比较器排序 :
TreeSet保证元素唯一和自然排序的原理
import java.util.Iterator;
import java.util.TreeSet;
public class Demo {
public static void main(String[] args) {
TreeSet<Integer> treeSet = new TreeSet<>();
// 我们给treeSet里面添加数据:乱序且重复
treeSet.add(5);
treeSet.add(5);
treeSet.add(6);
treeSet.add(2);
treeSet.add(7);
treeSet.add(4);
treeSet.add(2);
treeSet.add(3);
treeSet.add(1);
//treeSet------自然排序,元素唯一
Iterator<Integer> iterator = treeSet.iterator();
while (iterator.hasNext()){
System.out.println(iterator.next());
}
}
}
/*程序运行结果:
1
2
3
4
5
6
7*/
自然排序(字典顺序)
1)TreeSet类的add()方法中会把存入的对象提升为Comparable类型
2)调用对象的compareTo()方法和集合已有对象比较
3)根据compareTo()方法返回的结果进行存储
比较器排序
1)创建TreeSet的时候可以指定一个comparator(比较器)
2)如果传入了Comparator的子类对象,那么TreeSet就会按照比较器中的顺序排序
3)add()方法内部会自动调用Comparator接口中compare()方法来排序
二者的区别:
1)TreeSet构造函数什么都不传,默认按照Comparable的顺序
2)TreeSet如果传入Comparator,就优先按照比较器排序
自然排序
TreeSet保存的子类可以进行排序,但是其排序是依靠比较器接口(Comparable)实现的,如果要利用TreeSet子类保存自定义类的对象,那么这个对象所属的类必须要实现java.lang.Coparable接口。
public class Book implements Comparable<Book> {
private String title;
private double price;
public Book() {
}
public Book(String title, double price) {
this.title = title;
this.price = price;
}
public String getTitle() {
return title;
}
public void setTitle(String title) {
this.title = title;
}
public double getPrice() {
return price;
}
public void setPrice(double price) {
this.price = price;
}
@Override
public String toString() {
return "Book{" +
"title='" + title + '\'' +
", price=" + price +
'}';
}
// 排序方法:比较所有属性
// 先比较价格,价格相等再去比较书名(调用String类的compareTo()方法)
@Override
public int compareTo(Book o) {
if (this.price > o.price) {
return 1;
} else if (this.price < o.price) {
return -1;
} else {
return this.title.compareTo(o.title);
}
}
}
import java.util.TreeSet;
public class Test {
public static void main(String[] args) {
TreeSet<Book> books = new TreeSet<>();
books.add(new Book("西游记",80));
books.add(new Book("西游记", 80));
books.add(new Book("三国演义", 75));
books.add(new Book("红楼梦", 90));
books.add(new Book("水浒传", 69));
System.out.println(books);
}
}
// 程序运行结果:
[Book{title='水浒传', price=69.0},
Book{title='三国演义', price=75.0},
Book{title='西游记', price=80.0},
Book{title='红楼梦', price=90.0}]
在这个案例中我们首先利用TreeSet子类保存了若干个Book对象,由于Book类实现了Comparable接口,所以会自动将所有保存的Book类对象强制转换成Comparable接口对象,然后调用comparTo()方法进行排序,如果发现比较结果为0则认为是重复元素,将不再进行保存。所以TreeSet数据排序以及重复元素的消除依靠的是Comparable接口。
注意
在TreeSet子类中,由于其不允许保存重复元素(comparTo()方法返回0),如果说你自定义的对象中有5个元素,那么在重写必须comparTo()方法时必须将所有属性进行比较,否则TreeSet会错误的将某些数据认为是重复元素,从而造成数据丢失的情况。
比较器排序
构建一个比较器(要实现 Comparator 接口):
import java.util.Comparator;
public class sortByTitle implements Comparator<Book> {
@Override
public int compare(Book o1, Book o2) {
// 先按照书名的长度来排序
// 如果书名的长度一样,就去比较书名是否相同
// 如果书名长度和书名都一样,就按照价格排序
int num = o1.getTitle().length() - o2.getTitle().length();
int num2 = num == 0 ? o1.getTitle().compareTo(o2.getTitle()): num;
int num3 = num2 == 0 ? (int) o1.getPrice() - (int) o2.getPrice() : num2;
return num3;
}
}
TreeSet的有参构造,用我们新建的比较器来排序:
import java.util.TreeSet;
public class Test2 {
public static void main(String[] args) {
TreeSet<Book> books = new TreeSet<Book>(new sortByTitle());
books.add(new Book("西游记", 80));
books.add(new Book("西游记", 90));
books.add(new Book("三国演义", 75));
books.add(new Book("红楼梦", 80));
books.add(new Book("水浒传", 69));
books.add(new Book("文化苦旅", 80));
System.out.println(books);
}
}
// 程序运行结果:
[Book{title='水浒传', price=69.0},
Book{title='红楼梦', price=80.0},
Book{title='西游记', price=80.0},
Book{title='西游记', price=90.0},
Book{title='三国演义', price=75.0},
Book{title='文化苦旅', price=80.0}]
eg: 键盘录入3个学生信息(姓名,语文成绩,数学成绩,英语成绩),按照总分从高到低输出到控制台。
public class Student {
private String name;
private int chineseScore;
private int mathScore;
private int englishScore;
public Student() {
}
public Student(String name, int chineseScore, int mathScore, int englishScore) {
this.name = name;
this.chineseScore = chineseScore;
this.mathScore = mathScore;
this.englishScore = englishScore;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getChineseScore() {
return chineseScore;
}
public void setChineseScore(int chineseScore) {
this.chineseScore = chineseScore;
}
public int getMathScore() {
return mathScore;
}
public void setMathScore(int mathScore) {
this.mathScore = mathScore;
}
public int getEnglishScore() {
return englishScore;
}
public void setEnglishScore(int englishScore) {
this.englishScore = englishScore;
}
public int getTotalScore() {
return englishScore + mathScore + chineseScore;
}
@Override
public String toString() {
return "Student{" +
"name='" + name + '\'' +
", chineseScore=" + chineseScore +
", mathScore=" + mathScore +
", englishScore=" + englishScore +
'}';
}
}
import java.util.Comparator;
import java.util.Iterator;
import java.util.Scanner;
import java.util.TreeSet;
publi class SortGrade {
public static void main(String[] args) {
TreeSet<Student> students = new TreeSet<>(new Comparator<Student>() {
@Override
public int compare(Student o1, Student o2) {
// 默认按照总分来排序(加-降序),如果总分一样,就去比较姓名从而确保录入数据的唯一性
int num = -(o1.getTotalScore() - o2.getTotalScore());
int num2 = num == 0 ? o1.getName().compareTo(o2.getName()) : num;
return num2;
}
});
Scanner sc = new Scanner(System.in);
for (int i = 1; i < 4; i++) {
System.out.println("请输入第" + i + "个学生的姓名:");
String name = sc.next();
System.out.println("请输入第" + i + "个学生的语文成绩:");
int cS = sc.nextInt();
System.out.println("请输入第" + i + "个学生的数学成绩:");
int mS = sc.nextInt();
System.out.println("请输入第" + i + "个学生的英语成绩:");
int eS = sc.nextInt();
Student student = new Student(name, cS, mS, eS);
students.add(student);
}
System.out.println("按照总分来排序:");
Iterator<Student> iterator = students.iterator();
while (iterator.hasNext()){
System.out.println(iterator.next());
}
}
}
程序运行结果:
请输入第1个学生的姓名:
张三
请输入第1个学生的语文成绩:
100
请输入第1个学生的数学成绩:
100
请输入第1个学生的英语成绩:
100
请输入第2个学生的姓名:
李四
请输入第2个学生的语文成绩:
95
请输入第2个学生的数学成绩:
86
请输入第2个学生的英语成绩:
69
请输入第3个学生的姓名:
王五
请输入第3个学生的语文成绩:
100
请输入第3个学生的数学成绩:
94
请输入第3个学生的英语成绩:
79
按照总分来排序:
Student{name='张三', chineseScore=100, mathScore=100, englishScore=100}
Student{name='王五', chineseScore=100, mathScore=94, englishScore=79}
Student{name='李四', chineseScore=95, mathScore=86, englishScore=69}