最近吃了map的暗亏,特来此重新梳理集合理论。
为了使程序能方便地存储和操纵数目不固定的一组数据,JDK类库提供了Java集合,所有Java集合类都位于java.util包中。
与Java数组不同,Java集合中不能存放基本类型数据,而只能存放对象的引用。出于表达上的便利,通常把“集合中的对象的引用”简称为“集合中的对象”。存放引用类型数据,对于基本数据类型,其包装类有自动拆装箱功能亦可存放。(这里就要注意了,集合里面存的是对象的引用,所以每次添加数据都必须new新的)
Java中集合主要分为三种类型:
. Set : 无序,并且放进集合中的对象不能重复。
. List: 有序(放入的先后的次序), 放进集合中的对象可以重复。
. Map : 集合中的每一个元素包含一对键对象和值对象,集合中没有重复的键对象,值对象可以重复。(Key - Value键值对)<映射>(map之强:键、值都可以为null,也可以同时为null,表现形式(null,null),而不存在的数据就是一个null)
1. Collection(集合)和Iterator(迭代器)接口
Set和List接口继承了Collection接口
在Collection接口中声明了适用于Set和List的通用方法:
boolean add(Object o) : 向集合中加入一个对象的引用;
void clear() : 删除集合中的所有对象引用,即不再持有这些对象的引用;
boolean contains(Object o) : 判断在集合中是否持有特定对象的引用(也就是说它是无法判断值大小的);
boolean isEmpty() : 判断集合是否为空;
Iterator iterator() : 返回一个Iterator对象,可用它来遍历集合中的元素;
boolean remove(Object o) : 从集合中删除一个对象的引用;
int size() : 返回集合中元素的数目;
Object[] toArray() : 返回一个数组,该数组包含集合中的所有元素;
Iterator接口中的定义的方法可以帮我们去遍历集合中的元素。
Iterator接口隐藏底层集合的数据结构,向客户程序提供了遍历各种类型的集合的统一方法。Iterator接口中声明方法:
hasNext(): 判断集合中的元素是否遍历完毕,如没有,就返回true;
next() : 返回下一个元素;
remove() : 从集合中删除上一个由next()方法返回的元素;
2. Set
最简单的一种集合,集合中的对象无序(乱序)、不能重复。主要实现类包括:
. HashSet : 按照哈希算法来存取集合中的对象,存取速度比较快;
. TreeSet : 实现SortedSet接口,具有排序功能;
. LinkedHashSet: HashSet子类,不仅实现Hash算法,还实现链表数据结构,链表数据结构能提高插入和删除元素的性能;
一般用法:
Set集合中存放的是对象的引用,并且没有重复对象。
当一个新的对象加入到Set集合中时,Set的add方法遍历既存对象,通过equals方法比较新对象和既存对象是否有相等的。
1) HashSet
哈希值相同的对象,不一定是相同对象;
哈希值不同的对象,一定不是相同对象。
哈希算法可以缩短比较对象的时间,先比对当前对象的哈希值与已有对象的哈希值(hashCode()),拿到相同哈希值的对象群,不需要遍历所有对象来确定相同对象,仅遍历相同哈希值对象群即可(equals())。
按照哈希算法来存取集合中的对象,存取速度比较快。当向集合中加入一个对象时,HashSet会调用对象的hashCode()方法来获得哈希码,然后根据这个哈希码进一步计算出对象在集合中的存放位置。
在Object类中定义了hashCode()方法和equals()方法,Object类的equals()方法按照内存地址比较对象是否相等。
因此如果object.equals(object2)为true, 则表明object1变量和object2变量实际上引用同一个对象,那么object1和object2的哈希码也肯定相同。
为了保证HashSet能正常工作, 要求当两个对象用equals()方法比较的结果为true时,它们的哈希码也相等。
如果用户定义的Customer类覆盖了Object类的equals()方法,但是没有覆盖Object类的hashCode()方法,就会导致当customer1.equals(customer2)为true时,而customer1和customer2的哈希码不一定一样,这会使HashSet无法正常工作。(先调用对象的hashCode()方法比较,如果是true再调用equals方法比较,如果还是true再认为俩个对象是同一个)
2) TreeSet
TreeSet实现了SortedSet接口,能够对集合中的对象进行排序。当TreeSet向集合中加入一个对象时,会把它插入到有序的对象序列中。TreeSet支持两种排序方式:自然排序和客户化排序。默认情况下TreeSet采用的是自然排序方式。
a. 自然排序
在JDK类库中, 有一部分类实现了Comparable接口,如Integer、Double和String等。Comparable接口有一个compareTo(Object o)方法,它返回整数类型。对于x.comapreTo(y), 如果
返回值等于0, 表明 x=y
返回值大于0, 表明 x>y
返回值小于0, 表明 x **即:想表示出x比y大,让x.comapreTo(y)返回一个大于0的数字即可 TreeSet调用对象的compareTo()方法比较集合中对象的大小,然后进行升序排序,这种排序方式称为自然排序。 JDK类库中实现了Comparable接口的一些类的排序方式: Byte, Short, Integer, Long, Double, Float: 按数字大小排序; Character: 按字符的Unicode值的数字大小排序; String: 按字符串中字符的Unicode值排序; 使用自然排序, TreeSet中只能加入相同类型对象,且这些对象必须实现了Comparable接口。否则会抛出ClassCastException异常。 当修改了对象的属性后, TreeSet不会重新排序。最适合TreeSet排序的是不可变类(它们的对象的属性不能修改)。 b. 客户化排序 除了自然排序外, TreeSet还支持客户化排序。 Java.util.Comparator接口提供了具体的排序方法,它有一个compare(Object x, Object y)方法,用于比较两个对象的大小, 当compare(x,y): 返回值等于0, 表明 x=y 返回值大于0, 表明 x>y 返回值小于0, 表明 x 如果希望TreeSet按照Customer对象的name属性进行降序排列,可以先创建一个实现Comparator接口的类CustomerComparator 3. List 主要特征是其元素以线性方式存储,集合中允许存放重复对象。主要实现类包括: . ArrayList: 代表长度可变的数组。允许对元素进行快速的随机访问,但是向ArrayList中插入与删除元素的速度较慢; . LinkedList: 在实现中采用链表结构。对顺序访问进行了优化,向List中插入和删除元素的速度较快,随机访问速度则相对较慢。 这两种List一般在实现时我们毫不犹豫的实现了ArrayList,但是在实际操作时由于需要对List进行删改操作,导致最后顺序变了,在数据不是很多,而要不想改动很大的时候应该考虑使用LinkedList,最后得到的顺序不会乱,尤其那种带时间的。 .Vector: 是线程安全的集合 4. Map(栈空间结构即为map,堆空间即为set) HashMap 是线程不安全的集合。 HashTable是线程安全的集合。 TreeMap 可以进行排序(对key进行排序) Map是一种把键对象和值对象进行映射的集合,它的每一个元素都包含一对键对象和值对象。向Map集合中加入元素时,必须提供一对键对象和值对象,从Map集合中检索元素时,只要给出键对象,就会返回对应的值对象。 Key 只能是引用类型(值无序,不重复) Value 只能是引用类型 Map集合中的键对象不允许重复,如以相同的键对象加入多个值对象,第一次加入的值对象将被覆盖。 对于值对象则没有唯一性的要求,可以将任意多个键对象映射到同一个值对象上。 Map有两种比较常见的实现: 1) HashMap 按哈希算法来存取键对象,有很好的存取性能,为了保证HashMap能正常工作,和HashSet一样,要求当两个键对象通过equals()方法比较为true时,这两个键对象的hashCode()方法返回的哈希码也一样。 2) TreeMap 实现了SortedMap接口,能对键对象进行排序。和TreeSet一样,TreeMap也支持自然排序和客户化排序两种方式。(排序按照的是KEY值)Map中如果key值被判定为重复,新插入的对象的value将覆盖先插入的那个。 entrySet 将map的键值对作为单个对象转化为set Set s = map.entrySet(); Set s = map.KeySet(); 将map的key值作为单个对象转化为set Collection s = map.values(); 将map的value值作为对象转set 对于map的选择,我们也会毫不犹豫选择HashMap,至于线程安不安全,在于方法是否会加锁,一般方法不会加锁,所以比较喜欢用HashMap。 另附最喜欢的map遍历