Set集合类似于一个罐子,程序可以依次把多个对象“丢进”Set集合,而Set集合通常不能记住元素的添加顺序。实际上Set就是Collection
只是行为略有不同(Set不允许包含重复元素)。
Set集合不允许包含相同的元素,如果试图把两个相同元素加入同一个Set集合中,则添加操作失败,add()
方法返回false
,且新元素不会被加入。
Collection
。特征是插入无序,不可指定位置访问。Map
集合去写的。通过内部封装Map
集合来实现的比如HashSet
内部封装了HashMap
。== 或 eqauls
)的元素。HashSet
、TreeSet
。HashSet是Set接口的典型实现,大多数时候使用Set集合时就是使用这个实现类。HashSet按Hash算法来存储集合中的元素,因此具有很好的存取和查找性能。底层数据结构是哈希表。
哈希表:一个元素为链表的数组,综合了数组与链表的优点。
HashSet具有以下特点:
当向HashSet
集合中存入一个元素时,HashSet
会调用该对象的hashCode
方法来得到该对象的hashCode
值,然后根据该hashCode
值决定该对象在HashSet
中的存储位置。如果有两个元素通过equals
方法比较true
,但它们的hashCode
方法返回的值不相等,HashSet
将会把它们存储在不同位置,依然可以添加成功。
也就是说。HashSet
集合判断两个元素的标准是两个对象通过equals
方法比较相等,并且两个对象的hashCode
方法返回值也相等。
即:靠元素重写hashCode方法和equals方法来判断两个元素是否相等,如果相等则覆盖原来的元素,以此来确保元素的唯一性。
public class HashSetTest {
public static void main(String[] args) {
HashSet<String> hashSet = new HashSet<>(); //存储单值,元素不允许重复
hashSet.add("a");
hashSet.add("b");
hashSet.add("c");
hashSet.add("d");
//查询集合中是否存在某元素
System.out.println(hashSet.contains("a"));
//集合的容量
System.out.println(hashSet.size());
//判空操作
System.out.println(hashSet.isEmpty());
//迭代器遍历
Iterator<String> iterator = hashSet.iterator();
while (iterator.hasNext()) {
String next = iterator.next();
System.out.print(next + " ");
}
System.out.println();
//集合转数组
Object[] objects = hashSet.toArray();
System.out.println(Arrays.toString(objects));
}
}
当自定义对象没有重写hashCode和equals方法时
public class Student {
private String name;
private int age;
public Student() {
}
public Student(String name, int age) {
this.name = name;
this.age = age;
}
//省略get/set方法
}
public class HashSetTest {
public static void main(String[] args) {
Student s1 = new Student("张三", 30);
Student s2 = new Student("李四", 24);
Student s3 = new Student("王五", 23);
Student s4 = new Student("周天", 25);
Student s5 = new Student("刘琦", 29);
Student s6 = new Student("王五", 23);
HashSet<Student> hashSet = new HashSet<>();
hashSet.add(s1);
hashSet.add(s2);
hashSet.add(s3);
hashSet.add(s4);
hashSet.add(s5);
hashSet.add(s6);
for (Student student : hashSet) {
System.out.println(student.getName() + "***" + student.getAge());
}
}
}
当自定义对象重写hashCode和equals方法时
public class Student {
private String name;
private int age;
public Student() {
}
public Student(String name, int age) {
this.name = name;
this.age = age;
}
@Override
//判断判断两个对象是否相等,对象是否存在,对象的name和age是否相等
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
return age == student.age &&
Objects.equals(name, student.name);
}
@Override
//返回对象的name和age的hash值
public int hashCode() {
return Objects.hash(name, age);
}
//省略get/set方法
}
如果需要把某个类的对象保存到HashSet集合中,重写这个类的equals方法和hashCode方法时,应尽量保证两个对象通过equals发那个法比较返回true时,他们的hashCode方法返回值也相等。
为什么不直接使用数组,而用HashSet呢?
HashSet
就不一样了,HashCode
表用每个元素的hashCode
值来计算其存储位置,从而可以自由增加HashCode
的长度,并根据元素的hashCode
值来访问元素。而不用一个个遍历索引去访问,这就是它比数组快的原因。HashCode
中每个存储元素的“槽位”通常称为“桶”,如果多个元素的hashCode
值相同,但它们通过equals
方法比较返回false
,就需要在桶里放多个元素,这样会导致性能下降。hash表
当向HashSet中添加可变对象时,必须十分小心。如果修改HashSet集合中的对象,有可能导致该对象与集合中的其他对象相等,从而导致HashSet无法准确访问该对象。
HashSet还有一个子类LinkedList、LinkedHashSet集合也是根据元素的hashCode值来决定元素的存储位置,但它同时使用链表维护元素的次序,这样使得元素看起来是以插入的顺序保存的,也就是说当遍历集合LinkedHashSet集合里的元素时,集合将会按元素的添加顺序来访问集合里的元素。
输出集合里的元素时,元素顺序总是与添加顺序一致。但是LinkedHashSet依然是HashSet,因此它不允许集合重复。
TreeSet是SortedSet接口的实现类,TreeSet可以确保集合元素处于排序状态。
TreeSet内部实现的是红黑树,默认整形排序为从小到大。
与HashSet集合相比,TreeSet还提供了几个额外方法:
Comparator comparator()
:如果TreeSet采用了定制顺序,则该方法返回定制排序所使用的Comparator,如果TreeSet采用自然排序,则返回null;Object first()
:返回集合中的第一个元素;Object last()
:返回集合中的最后一个元素;Object lower(Object e)
:返回指定元素之前的元素。Object higher(Object e)
:返回指定元素之后的元素。SortedSet subSet(Object fromElement,Object toElement)
:返回此Set的子集合,含头不含尾;SortedSet headSet(Object toElement)
:返回此Set的子集,由小于toElement的元素组成;SortedSet tailSet(Object fromElement)
:返回此Set的子集,由大于fromElement的元素组成;public class TreeSetTest {
public static void main(String[] args) {
TreeSet<Integer> nums = new TreeSet<>();
//向集合中添加元素
nums.add(5);
nums.add(2);
nums.add(15);
nums.add(-4);
//输出集合,可以看到元素已经处于排序状态
System.out.println(nums);//[-4, 2, 5, 15]
System.out.println("集合中的第一个元素:"+nums.first());//集合中的第一个元素:-4
System.out.println("集合中的最后一个元素:"+nums.last());//集合中的最后一个元素:15
System.out.println("集合小于4的子集,不包含4:"+nums.headSet(4));//集合小于4的子集,不包含4:[-4, 2]
System.out.println("集合大于5的子集:"+nums.tailSet(2));//集合大于5的子集:[2, 5, 15]
System.out.println("集合中大于等于-3,小于4的子集:"+nums.subSet(-3,4));//集合中大于等于-3,小于4的子集:[2]
}
}
从上面的运行结果可以看出输出的集合已经按从小到大排好了,但是问题来了,只能从小到大排序吗?如果是字符对象应按该怎样的顺序排序?如果是一个学生对象又按怎样的顺序排序呢?遵循怎样的排序规则呢?
TreeSet会调用集合元素的compareTo(Objec obj)
方法来比较元素之间的大小关系,然后将集合元素按升序排列,这就是自然排序。
Java提供了一个Comparable接口,该接口里定义了一个compareTo(Object obj)方法,该方法返回一个整数值,实现该接口的类必须实现该方法,实现了该接口的类必须实现该方法,实现接口的类就可以比较大小了。当调用一个一个对象调用该方法与另一个对象进行比较时,obj1.compareTo(obj2)如果返回0表示两个对象相等;如果返回正整数则表明obj1大于obj2,如果是负整数则相反。
示例场景:
public class Student implements Comparable<Student> {
private String name;
private int age;
public Student(String name, int age) {
this.name = name;
this.age = age;
}
//省略get/set方法
@Override
public int compareTo(Student o) {
//比较age
int num = this.age - o.age;
//如果age相等则比较name长度
int num1 = num == 0 ? this.name.length() - o.name.length() : num;
//如果前两者都相等则比较name字符串
int num2 = num1 == 0 ? this.name.compareTo(o.name) : num1;
return num2;
}
}
public class TreeSetTest {
public static void main(String[] args) {
TreeSet<Student> tree = new TreeSet<>();
//向集合中添加元素
tree.add(new Student("张三",16));
tree.add(new Student("李四",17));
tree.add(new Student("王五",16));
tree.add(new Student("周天",16));
tree.add(new Student("刘琦",23));
tree.add(new Student("王五",16));
//遍历
System.out.println(tree);
/**
* [Student{name='周天', age=16},
* Student{name='张三', age=16},
* Student{name='王五', age=16},
* Student{name='李四', age=17},
* Student{name='刘琦', age=23}]
*/
}
}
从运行结果可以看到满足定义的排序规则。
当把一个对象添加进集合时,集合调用该对象的CompareTo(Object obj)
方法与容器中的其他对象比较大小,然后根据红黑树结构中找到它的存储位置。如果两个对象相等则新对象无法加入到集合中。
注意:
CompareTo(Object o)
方法时,都需要将被比较对象obj
强制类型转换成相同类型,因为只有相同的两个实例才会比较大小。Comparable
接口,否则会引发ClassCastException
异常。TreeSet
集合中添加元素时,只有第一个元素无须实现Comparable
接口,后面添加的所有元素都必须实现Comparable
接口。当然这也不是一种好做法,当试图从TreeSet
中取出元素时,依然会引发ClassCastException
异常。TreeSet
集合不会再次调整它们的顺序,这点和HashSet
一样。总结:如果希望TreeSet能正常工作,TreeSet只能添加同一种类型的对象。
对于TreeSet集合而言,它判断两个对象是否相等的唯一标准是:两个对象通过compareTo(Object obj)方法比较是否返回0,如果是0则认为对象相等,否则认为不相等。
修改上述案例:
public class Student implements Comparable<Student> {
private String name;
private int age;
public Student(String name, int age) {
this.name = name;
this.age = age;
}
//省略get/set方法
@Override
public int compareTo(Student o) {
return 1;
}
@Override
public boolean equals(Object o) {
return true;
}
}
public class TreeSetTest {
public static void main(String[] args) {
TreeSet<Student> tree = new TreeSet<>();
Student s1 = new Student("李明",23);
tree.add(s1);
//遍历
System.out.println(tree);//[Student{name='李明', age=23}]
tree.add(s1);
System.out.println(tree);//[Student{name='李明', age=23}, Student{name='李明', age=23}]
//更改第一个元素的age
tree.first().setAge(33);
System.out.println(tree.last().getAge());//33
}
}
equals
总是返回true
,但是TreeSet
总认为添加的两个对象不相等,可以看到修改第一个元素的age
,最后一个元素的age
也被修改。这是因为集合中存储的只是对象的引用,这两个对象的引用指向同一个对象,所以age
变量也被随之改变。TreeSet
的自然排序是根据集合元素的大小,TreeSet
将它们以升序排列。如果需要实现定制排序,例如降序排序,则可通过Comparator
接口的帮助。该接口里包含一个int compare(T o1,T o2)
方法,用于比较o1
和o2
的大小。由于Comparator
是一个函数式接口,因此还可以使用Lambda
表达式来代替Comparator
子类对象。
public class TreeSetTest {
public static void main(String[] args) {
TreeSet<Integer> nums = new TreeSet<>(new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return o1-o2;
}
});
//向集合中添加元素
nums.add(5);
nums.add(2);
nums.add(15);
nums.add(-4);
//输出集合,可以看到元素已经处于排序状态
System.out.println(nums);//[-4, 2, 5, 15]
}
}
public class TreeSetTest {
public static void main(String[] args) {
TreeSet<Integer> nums = new TreeSet<>(new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return -(o1-o2);
}
});
//向集合中添加元素
nums.add(5);
nums.add(2);
nums.add(15);
nums.add(-4);
//输出集合,可以看到元素已经处于排序状态
System.out.println(nums);//[15, 5, 2, -4]
}
}
public class TreeSetTest {
public static void main(String[] args) {
TreeSet<Integer> nums = new TreeSet<>((a, b) -> -(a - b));
//向集合中添加元素
nums.add(5);
nums.add(2);
nums.add(15);
nums.add(-4);
//输出集合,可以看到元素已经处于排序状态
System.out.println(nums);//[15, 5, 2, -4]
}
}
定制排序的特征和自然排序相同,不能添加相同的对象。
EnumSet类的特征:
EnumSet
是一个专门为枚举类设计的集合类,EnumSet
中的所有元素都必须是指定枚举类型的枚举值,该枚举类型在创建EnumSet
时显式或隐式地指定。EnumSet
的集合元素也是有序的,EnumSet
以枚举值在Enum
类内的定义顺序来决定集合元素的顺序。EnumSet
在内部以位向量的形式存储,这种存储形式非常紧凑、高效,因此EnumSet
对象占用内存很小,而且运行效率很好。EnumSet
集合不允许加入null
元素。EnumSet类没有暴露任何构造器来创建该类的实例,EnumSet类提供了以下类方法来创建EnumSet对象。
EnumSet allOf(Class elementType)
:创建一个包含指定枚举类里所有枚举值的EnumSet集合。EnumSet complementOf(EnumSet s)
:创建一个其元素类型与指定EnumSet
里元素类型相同的EnumSet
集合,新的集合里包含原集合不包含的枚举值。EnumSet copyOf(Collection c)
:使用一个普通集合来创建EnumSet
集合;EnumSet copyOf(EnumSet s)
:复制原集合;EnumSet noneOf(Class elementType)
:创建一个元素类型为指定枚举类型的空EnumSet;EnumSet of(E first,E...rest)
:创建一个包含一个或多个枚举值的EnumSet集合。传入的枚举值必须是同一枚举类。EnumSet range(E from,E to)
:创建一个包含从from到to枚举值范围所有枚举值的EnumSet集合。enum SeasonEnum {
//在第一行列出4个枚举实例
Spring,Summer,Fall,Winter;
}
public class EnumSetTest {
public static void main(String[] args) {
//创建一个EnumSet集合,集合元素是Season枚举类的全部枚举值
EnumSet<SeasonEnum> es1 = EnumSet.allOf(SeasonEnum.class);
System.out.println(es1);//[Spring, Summer, Fall, Winter]
//创建一个EnumSet空集合,元素类型为Season类的枚举值
EnumSet<SeasonEnum> es2 = EnumSet.noneOf(SeasonEnum.class);
System.out.println(es2);//[]
//手动添加两个元素
es2.add(SeasonEnum.Spring);
es2.add(SeasonEnum.Summer);
System.out.println(es2);//[Spring, Summer]
//以指定枚举值创建EnumSet结合
EnumSet<SeasonEnum> es3 = EnumSet.of(SeasonEnum.Spring, SeasonEnum.Fall);
System.out.println(es3);//[Spring, Fall]
EnumSet<SeasonEnum> es4 = EnumSet.range(SeasonEnum.Summer, SeasonEnum.Winter);
System.out.println(es4);//[Summer, Fall, Winter]
//输出es4中不包含的枚举值
EnumSet<SeasonEnum> es5 = EnumSet.complementOf(es4);
System.out.println(es5);//[Spring]
}
}
public class CopyTest{
public static void main(String[] args) {
Collection c = new HashSet<>();
c.clear();
c.add(SeasonEnum.Spring);
c.add(SeasonEnum.Summer);
//复制集合中的元素来创建EnumSet
EnumSet enumSet = EnumSet.copyOf(c);
System.out.println(enumSet);//[Spring, Summer]
c.add("Monday");
c.add("ThusDay");
EnumSet enumSet1 = EnumSet.copyOf(c);
//出现ClassCastException异常,因为后面添加的两个元素不是枚举值
}
}
文章参考链接: