JAVA集合

    最近吃了map的暗亏,特来此重新梳理集合理论。    

    为了使程序能方便地存储和操纵数目不固定的一组数据,JDK类库提供了Java集合,所有Java集合类都位于java.util包中。

    与Java数组不同,Java集合中不能存放基本类型数据,而只能存放对象的引用。出于表达上的便利,通常把“集合中的对象的引用”简称为“集合中的对象”。存放引用类型数据,对于基本数据类型,其包装类有自动拆装箱功能亦可存放。(这里就要注意了,集合里面存的是对象的引用,所以每次添加数据都必须new新的)

    Java中集合主要分为三种类型:

. Set : 无序,并且放进集合中的对象不能重复。

      . List: 有序(放入的先后的次序), 放进集合中的对象可以重复。

      . Map : 集合中的每一个元素包含一对键对象和值对象,集合中没有重复的键对象,值对象可以重复。(Key - Value键值对)<映射>(map之强:键、值都可以为null,也可以同时为null,表现形式(null,null),而不存在的数据就是一个null)

1. Collection(集合)和Iterator(迭代器)接口

   Set和List接口继承了Collection接口

       在Collection接口中声明了适用于Set和List的通用方法:

boolean add(Object o)      : 向集合中加入一个对象的引用;

void clear()               : 删除集合中的所有对象引用,即不再持有这些对象的引用;

boolean contains(Object o) : 判断在集合中是否持有特定对象的引用(也就是说它是无法判断值大小的);

boolean isEmpty()          : 判断集合是否为空;

Iterator iterator()        : 返回一个Iterator对象,可用它来遍历集合中的元素;

boolean remove(Object o)   : 从集合中删除一个对象的引用;

int size()                 : 返回集合中元素的数目;

Object[] toArray()         : 返回一个数组,该数组包含集合中的所有元素;

Iterator接口中的定义的方法可以帮我们去遍历集合中的元素。

    Iterator接口隐藏底层集合的数据结构,向客户程序提供了遍历各种类型的集合的统一方法。Iterator接口中声明方法:

hasNext(): 判断集合中的元素是否遍历完毕,如没有,就返回true;

next()   : 返回下一个元素;

remove() : 从集合中删除上一个由next()方法返回的元素;

2. Set

最简单的一种集合,集合中的对象无序(乱序)、不能重复。主要实现类包括:

     . HashSet      : 按照哈希算法来存取集合中的对象,存取速度比较快;

     . TreeSet      : 实现SortedSet接口,具有排序功能;

. LinkedHashSet: HashSet子类,不仅实现Hash算法,还实现链表数据结构,链表数据结构能提高插入和删除元素的性能;

     一般用法:

Set集合中存放的是对象的引用,并且没有重复对象。

当一个新的对象加入到Set集合中时,Set的add方法遍历既存对象,通过equals方法比较新对象和既存对象是否有相等的。

    1) HashSet

  哈希值相同的对象,不一定是相同对象;

  哈希值不同的对象,一定不是相同对象。

  哈希算法可以缩短比较对象的时间,先比对当前对象的哈希值与已有对象的哈希值(hashCode()),拿到相同哈希值的对象群,不需要遍历所有对象来确定相同对象,仅遍历相同哈希值对象群即可(equals())。

    按照哈希算法来存取集合中的对象,存取速度比较快。当向集合中加入一个对象时,HashSet会调用对象的hashCode()方法来获得哈希码,然后根据这个哈希码进一步计算出对象在集合中的存放位置。

在Object类中定义了hashCode()方法和equals()方法,Object类的equals()方法按照内存地址比较对象是否相等。

因此如果object.equals(object2)为true, 则表明object1变量和object2变量实际上引用同一个对象,那么object1和object2的哈希码也肯定相同。

为了保证HashSet能正常工作, 要求当两个对象用equals()方法比较的结果为true时,它们的哈希码也相等。

如果用户定义的Customer类覆盖了Object类的equals()方法,但是没有覆盖Object类的hashCode()方法,就会导致当customer1.equals(customer2)为true时,而customer1和customer2的哈希码不一定一样,这会使HashSet无法正常工作。(先调用对象的hashCode()方法比较,如果是true再调用equals方法比较,如果还是true再认为俩个对象是同一个)

2) TreeSet

TreeSet实现了SortedSet接口,能够对集合中的对象进行排序。当TreeSet向集合中加入一个对象时,会把它插入到有序的对象序列中。TreeSet支持两种排序方式:自然排序和客户化排序。默认情况下TreeSet采用的是自然排序方式。

a. 自然排序

在JDK类库中, 有一部分类实现了Comparable接口,如Integer、Double和String等。Comparable接口有一个compareTo(Object o)方法,它返回整数类型。对于x.comapreTo(y), 如果

          返回值等于0, 表明   x=y

          返回值大于0, 表明   x>y

          返回值小于0, 表明   x

**即:想表示出x比y大,让x.comapreTo(y)返回一个大于0的数字即可

TreeSet调用对象的compareTo()方法比较集合中对象的大小,然后进行升序排序,这种排序方式称为自然排序。

JDK类库中实现了Comparable接口的一些类的排序方式: 

Byte, Short, Integer, Long, Double, Float:   按数字大小排序;

Character:                                   按字符的Unicode值的数字大小排序;

String:                                      按字符串中字符的Unicode值排序; 

使用自然排序, TreeSet中只能加入相同类型对象,且这些对象必须实现了Comparable接口。否则会抛出ClassCastException异常。

     当修改了对象的属性后, TreeSet不会重新排序。最适合TreeSet排序的是不可变类(它们的对象的属性不能修改)。

      b. 客户化排序                

除了自然排序外, TreeSet还支持客户化排序。

Java.util.Comparator接口提供了具体的排序方法,它有一个compare(Object x, Object y)方法,用于比较两个对象的大小, 当compare(x,y):

                     返回值等于0, 表明   x=y

                     返回值大于0, 表明   x>y

                     返回值小于0, 表明   x

      如果希望TreeSet按照Customer对象的name属性进行降序排列,可以先创建一个实现Comparator接口的类CustomerComparator

3. List

     主要特征是其元素以线性方式存储,集合中允许存放重复对象。主要实现类包括:

      . ArrayList: 代表长度可变的数组。允许对元素进行快速的随机访问,但是向ArrayList中插入与删除元素的速度较慢;

      . LinkedList: 在实现中采用链表结构。对顺序访问进行了优化,向List中插入和删除元素的速度较快,随机访问速度则相对较慢。

这两种List一般在实现时我们毫不犹豫的实现了ArrayList,但是在实际操作时由于需要对List进行删改操作,导致最后顺序变了,在数据不是很多,而要不想改动很大的时候应该考虑使用LinkedList,最后得到的顺序不会乱,尤其那种带时间的。

 .Vector:     是线程安全的集合             

4. Map(栈空间结构即为map,堆空间即为set)

   HashMap  是线程不安全的集合。

   HashTable是线程安全的集合。

   TreeMap  可以进行排序(对key进行排序)

      Map是一种把键对象和值对象进行映射的集合,它的每一个元素都包含一对键对象和值对象。向Map集合中加入元素时,必须提供一对键对象和值对象,从Map集合中检索元素时,只要给出键对象,就会返回对应的值对象。

Key   只能是引用类型(值无序,不重复)

Value 只能是引用类型 

      Map集合中的键对象不允许重复,如以相同的键对象加入多个值对象,第一次加入的值对象将被覆盖。

      对于值对象则没有唯一性的要求,可以将任意多个键对象映射到同一个值对象上。

      Map有两种比较常见的实现:

      1) HashMap

按哈希算法来存取键对象,有很好的存取性能,为了保证HashMap能正常工作,和HashSet一样,要求当两个键对象通过equals()方法比较为true时,这两个键对象的hashCode()方法返回的哈希码也一样。

      2) TreeMap

实现了SortedMap接口,能对键对象进行排序。和TreeSet一样,TreeMap也支持自然排序和客户化排序两种方式。(排序按照的是KEY值)Map中如果key值被判定为重复,新插入的对象的value将覆盖先插入的那个。

 

entrySet  将map的键值对作为单个对象转化为set

Set s = map.entrySet();

 

Set s = map.KeySet();  将map的key值作为单个对象转化为set

Collection s = map.values(); 将map的value值作为对象转set


对于map的选择,我们也会毫不犹豫选择HashMap,至于线程安不安全,在于方法是否会加锁,一般方法不会加锁,所以比较喜欢用HashMap。

另附最喜欢的map遍历

  1. Map map = new HashMap();  
  2.   
  3. for (Map.Entry entry : map.entrySet()) {  
  4.   
  5.     System.out.println("Key = " + entry.getKey() + ", Value = " + entry.getValue());  
  6.   
  7. }  

你可能感兴趣的:(java)