可以动态保存任意多个对象,使用比较方便
提供了一系列方便的操作对象的方法: add
、remove
、set
、get
等,添加/删除新元素简洁了
Java 的集合类很多,主要分为两大类 Collection
和 Map
Collection
接口有两个重要的子接口List
Set
, 他们的实现子类都是单列集合 (单列数据)
Map
接口的实现子类是双列集合,存放的K-V (双列数据)
public interface Collection <E> extends lterable <E>
collection
实现子类可以存放多个元素,每个元素可以是Object
Collection
接口没有直接的实现子类,是通过它的子接口 Set
和 List
来实现的Collection方法
由于Collection
没有直接子类,List
是 Collection
的子接口实现,因此这里用List
展示Collection
类方法
import java.util.ArrayList;
import java.util.List;
public class CollectionMethod {
@SuppressWarnings({"all"})
public static void main(String[] args) {
List list = new ArrayList();
// add:添加单个元素
list.add("jack");
list.add(10);//list.add(new Integer(10)) 本质是对象
list.add(true);
System.out.println("list=" + list);
// remove:删除指定元素
list.remove(0);//删除第一个元素 返回boolen
list.remove(true);//指定删除某个元素 返回该obj
System.out.println("list=" + list);
// contains:查找元素是否存在
System.out.println(list.contains("jack"));//T
// size:获取元素个数
System.out.println(list.size());//2
// isEmpty:判断是否为空
System.out.println(list.isEmpty());//F
// clear:清空
list.clear();
System.out.println("list=" + list);
// addAll:添加多个元素
ArrayList list2 = new ArrayList();
list2.add("红楼梦");
list2.add("三国演义");
list.addAll(list2);
System.out.println("list=" + list);
// containsAll:查找多个元素是否都存在
System.out.println(list.containsAll(list2));//T
// removeAll:删除多个元素
list.add("聊斋");
list2.add("时间是金");
list.removeAll(list2);
System.out.println("list=" + list);//[聊斋]
}
}
Collection遍历
Iterator
迭代器,主要用于遍历Collection
集合中的元素。
所有实现了Collection
接口的集合类都有一个iterator()
方法,用以返回一个实现了lterator
接口的对象,即可以返回一个迭代器。
在调用iterator.next()
方法之前必须要调用iterator.hasNext()
进行检测。
若不调用,且下一条记录无效,直接调用iterator.next()
会抛出NoSuchElementException
异常。
增强for循环,可以代替iterator
迭代器
特点:增强for就是简化版的iterator
,本质一样。只能用于遍历集合或数组。
for(元素类型 元素名:集合名或数组名){
}
List
接口是 Collection
接口的子接口
List
集合类中元素有序(即添加顺序和取出顺序一致)、且可重复
List
集合中的每个元素都有其对应的顺序索引,即支持索引
List
容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素
List 方法
add
(int index, Object ele):在index位置插入ele元素addAll
(int index, Collection eles):从index位置开始将eles中的所有元素添加进来get
(int index):获取指定index位置的元素indexOf
(Object obj):返回obj在集合中首次出现的位置lastIndexOf
(Object obj):返回obj在当前集合中末次出现的位置remove
(int index):移除指定index位置的元素,并返回此元素set
(int index, Object ele):设置指定index位置的元素为ele , 相当于是替换.subList
(int fromIndex, int toIndex):返回从fromIndex到toIndex位置的子集合。(fromIndex <= subList < toIndex)这部分方法是List
独有的,set
用不了
ArrayList
可以加入null
(空值),并且可以是多个
ArrayList
是由数组来实现数据存储的
ArrayList
基本等同于Vector
,除了ArrayList
是线程不安全(执行效率高)。在多线程情况下,不建议使用ArrayList。
ArrayList
中维护了一个Object
类型的数组elementData
分析
当创建ArrayList
对象时,如果使用的是无参构造器,则初始elementData
容量为0,第1次添加,则扩容elementData
为10,如需要再次扩容,则扩容elementData
为1.5倍。
如果使用的是指定大小的构造器,则初始elementData
容量为指定大小,如果需要扩容,则直接扩容elementData
为1.5倍。
public class vector<E>extends AbstractList<E>
implements List<E>,RandomAccess,cloneable,Serializable
分析
Vector
底层也是一个对象数组, protected Object[] elementData;
Vector
是线程同步的,即线程安全, Vector
类的操作方法带有
synchronizedpublic synchronized E get(int index){
if (index >= elementCount)
throw new ArraylndexOutOfBoundsException(index);
return elementData(index);
}
比较
底层架构 | 版本 | 线程安全(同步)效率 | 扩容倍数 | |
---|---|---|---|---|
ArrayList | 可变数组 | jdk1.2 | 不安全,效率高 | 如果是无参,默认10,第二次开始按1.5倍扩容。如果指定大小,则每次直接按1.5倍扩容 |
Vector | 可变数组 Object[] | jdk1.0 | 安全,效率不高 | 如果是无参,默认10,满后就按2倍扩容。如果指定大小,则每次直接按两倍扩容 |
LinkedList
底层实现了双向链表和双端队列特点,可以添加任意元素(元素可以重复),包括null
线程不安全,没有实现同步
分析
LinkedList
中维护了两个属性first
和last
分别指向首节点和尾节点
每个节点(Node对象),里面又维护了prev
、next
、item
三个属性,其中通过prev
指向前一个,通过next
指向后一个节点,最终实现双向链表,所以LinkedList
的元素的添加和删除,不是通过数组完成的,相对来说效率较高。
比较
底层架构 | 增删的效率 | 改查的效率 | |
---|---|---|---|
ArrayList | 可变数组 | 较低 数组扩容 | 较高 |
LinkedList | 双向链表 | 较高 链表追加 | 较低 |
ArrayList
LinkedList
ArrayList
无序(添加和取出的顺序不一致),没有索引,不允许重复元素,所以最多包含一个null
Set 方法
和List 接口一样, Set 接口也是Collection 的子接口,因此,常用方法和Collection 接口一样.
Set遍历
同Collection的遍历方式一样,因为Set接口是Collection接口的子接口。
可以使用迭代器或增强for,不能使用索引的方式来获取
HashSet
实际上是HashMap
public Hashset() {
map = new HashMap<>();
}
可以存放null
值,但是只能有一个null
HashSet
不保证元素是有序的,取决于hash
后,再确定索引的结果。(即,不保证存放元素的顺序和取出顺序一致)
分析
添加一个元素时,先得到hash
值-会转成->索引值
找到存储数据表table
,看这个索引位置是否已经存放的有元素,如果没有,直接加入
如果有,调用equals
比较,如果相同,就放弃添加,`如果不相同,则添加到最后
在Java8中,如果一条链表的元素个数到达 TREEIFY_THRESHOLD
(默认是8),并且table
的大小>=MIN TREEIFY CAPACITY
(默认64),就会进行树化(红黑树),否则仍然会采用数组扩容机制。
HashSet
底层是HashMap
,第一次添加时,table
数组扩容到16,临界值(threshold
)是16* 加载因子 (loadFactor
)是0.75 = 12
如果table
数组使用到了临界值12,就会扩容到16* 2=32,新的临界值就是32*0.75 =24。依次类推
package com.hspedu.set_;
import java.util.HashSet;
@SuppressWarnings({"all"})
public class HashSetSource {
public static void main(String[] args) {
HashSet hashSet = new HashSet();
hashSet.add("java");//到此位置,第1次add分析完毕.
hashSet.add("php");//到此位置,第2次add分析完毕
hashSet.add("java");
System.out.println("set=" + hashSet);
/*
对HashSet 的源码解读
1. 执行 HashSet()
public HashSet() {
map = new HashMap<>();
}
2. 执行 add()
public boolean add(E e) {//e = "java"
return map.put(e, PRESENT)==null;// (static) PRESENT = new Object();
}
3.执行 put() , 该方法会执行 hash(key) 得到key对应的hash值 算法:h = key.hashCode()) ^ (h >>> 16) 可见这个hash的值并不是hashcode,而是做了一定的处理 >>> 16.
public V put(K key, V value) {//key = "java" value = PRESENT 共享
return putVal(hash(key), key, value, false, true);
}
4.执行 putVal !!!!!!!!!!!!!!!!!
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node[] tab; Node p; int n, i; //定义了辅助变量
//table 就是 HashMap 的一个数组,类型是 Node[] (前面我们也模拟过)
//if 语句表示如果当前table 是null, 或者 大小=0
//就是第一次扩容,到16个空间.
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//(1)根据key,得到hash 去计算该key应该存放到table表的哪个索引位置并把这个位置的对象,赋给 p
//(2)判断 p 是否为null
//(2.1) 如果 p 为null, 表示还没有存放元素, 就创建一个 Node (key="java",value=PRESENT)
//(2.2) 就放在该位置 tab[i] = newNode(hash, key, value, null)
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null); // 这个null类似与模拟节点的null,其后面还没有挂载节点
else {
//一个开发技巧提示: 在需要局部变量(辅助变量)时候,在创建
Node e; K k; //
//如果当前索引位置对应的链表的第一个元素和准备添加的key的hash值一样
//并且满足 下面两个条件之一:
// (1) 准备加入的key 和 p 指向的Node 结点的 key 是同一个对象
// (2) p 指向的Node 结点的 key 的equals() 和准备加入的key比较后相同
//就不能加入
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//再判断 p 是不是一颗红黑树,
//如果是一颗红黑树,就调用 putTreeVal , 来进行添加
else if (p instanceof TreeNode)
e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
else {//如果table对应索引位置,已经是一个链表, 就使用for循环比较
//(1) 依次和该链表的每一个元素比较后,都不相同, 则加入到该链表的最后
// 注意在把元素添加到链表后,立即判断 该链表是否已经达到8个结点
// , 就调用 treeifyBin() 对当前这个链表进行树化(转成红黑树)
// 注意,在转成红黑树时,要进行判断, 判断条件
// if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY(64))
// resize();
// 如果上面条件成立,先table扩容.
// 只有上面条件不成立时,才进行转成红黑树
//(2) 依次和该链表的每一个元素比较过程中,如果有相同情况,就直接break
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD(8) - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//size 就是我们每加入一个结点Node(k,v,h,next), size++
if (++size > threshold)
resize();//扩容
afterNodeInsertion(evict);
return null;
}
*/
}
}
LinkedHashSet
是 HashSet
的子类
LinkedHashSet
底层是一个 LinkedHashMap
,底层维护了一个数组+双向链表
LinkedHashSet
根据元素的hashCode
值来决定元素的存储位置,同时使用链表维护元素的次序(图),这使得元素看起来是以插入顺序保存
LinkedHashSet
不允许添重复元素
分析
在LinkedHastSet
中维护了一个hash
表和双向链表( LinkedHashSet
有 head
和tail
)
每一个节点有before
和after
属性,这样可以形成双向链表
在添加一个元素时,先求hash
值,在求索引,确定该元素在table
的位置,然后将添加的元素加入到双向链表(如果已经存在,不添加[原则和hashset
一样])
这样的话,我们遍历LinkedHashSet
也能确保插入顺序和遍历顺序一致
Map
与Collection
并列存在。用于保存具有映射关系的数据:Key-Value
Map
接口的常用实现类:HashMap
、Hashtable
和Properties
Map
中的key
不允许重复,原因和HashSet
一样,value
可以重复
Map
的key
可以为null
, value
也可以为null
,注意key
为null
,只能有一个,value
为null
,可以多个
常用String
类作为Map
的key
key
和 value
之间存在单向一对一关系,即通过指定的 key
总能找到对应的value
Map
中的key
和value
可以是任何引用类型的数据,会封装到HashMap$Node
对象中,又因为Node
实现了Entry
接口,有些书上也说一对 k-v
就是一个Entry
但是本质上Entry还是指向HashMap$Node中的元素,并不是复制版存储。
Map方法
import java.util.HashMap;
import java.util.Map;
@SuppressWarnings({"all"})
public class MapMethod {
public static void main(String[] args) {
//演示map接口常用方法
Map map = new HashMap();
map.put("fh", new Book("", 100));//OK
map.put("fh", "bnd");//替换-> 一会分析源码
map.put("fgd", "mr");//OK
map.put("sgfh", "mr");//OK
map.put("vcbhhd", null);//OK
map.put(null, "dfhdfg");//OK
map.put("lh", "gct");//OK
map.put("hsp", "hspd");
System.out.println("map=" + map);
// remove:根据键删除映射关系
map.remove(null);
System.out.println("map=" + map);
// get:根据键获取值
Object val = map.get("lh");
System.out.println("val=" + val);
// size:获取元素个数
System.out.println("k-v=" + map.size());
// isEmpty:判断个数是否为0
System.out.println(map.isEmpty());//F
// clear:清除k-v
//map.clear();
System.out.println("map=" + map);
// containsKey:查找键是否存在
System.out.println("结果=" + map.containsKey("hsp"));//T
}
}
class Book {
private String name;
private int num;
public Book(String name, int num) {
this.name = name;
this.num = num;
}
}
Map遍历
containsKey
查找键是否存在keySet
获取所有的键entrySet
获取所有关系k-vvalues
获取所有的值HashMap
是 Map
接口使用频率最高的实现类。
HashMap
是以key-val
对的方式来存储数据(HashMap$Node
类型)
key
不能重复,但是值可以重复,允许使用null
键和null
值
如果添加相同的key
,则会覆盖原来的key-val
,等同于修改(key
不会替换,val
会替换)
与HashSet
一样,不保证映射的顺序,因为底层是以hash
表的方式来存储的. (jdk8的hashMap
底层数组+链表+红黑树)
HashMap
没有实现同步,因此是线程不安全的,方法没有做同步互斥的操作,没有synchronized
分析
HashMap
底层维护了Node
类型的数组table
,默认为null
当创建对象时,将加载因子(Ioadfactor
)初始化为0.75.
当添加key-val
时,通过key
的哈希值得到在table
的索引。然后判断该索引处是否有元素,如果没有元素直接添加。
如果该索引处有元素,继续判断该元素的key
和准备加入的key
是否相等,如果相等,则直接替换val
如果不相等需要判断是树结构还是链表结构,做出相应处理。如果添加时发现容量不够,则需要扩容。
第1次添加,则需要扩容table
容量为16,临界值(threshold
)为12 (16*0.75)
以后再扩容,则需要扩容table
容量为原来的2倍(32),临界值为原来的2倍,即24,依次类推.
在Java8中,如果一条链表的元素个数超过 TREEIFY_THRESHOLD
(默认是8),并且table
的大小>= MIN TREEIFY CAPACITY
(默认64),就会进行树化(红黑树)
package com.hspedu.map_;
import java.util.HashMap;
@SuppressWarnings({"all"})
public class HashMapSource1 {
public static void main(String[] args) {
HashMap map = new HashMap();
map.put("java", 10);//ok
map.put("php", 10);//ok
map.put("java", 20);//替换value
System.out.println("map=" + map);//
/*解读HashMap的源码+图解
1. 执行构造器 new HashMap()
初始化加载因子 loadfactor = 0.75
HashMap$Node[] table = null
2. 执行put 调用 hash方法,计算 key的 hash值 (h = key.hashCode()) ^ (h >>> 16)
public V put(K key, V value) {//K = "java" value = 10
return putVal(hash(key), key, value, false, true);
}
3. 执行 putVal
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node[] tab; Node p; int n, i;//辅助变量
//如果底层的table 数组为null, 或者 length =0 , 就扩容到16
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//取出hash值对应的table的索引位置的Node, 如果为null, 就直接把加入的k-v
//, 创建成一个 Node ,加入该位置即可
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node e; K k;//辅助变量
// 如果table的索引位置的key的hash相同和新的key的hash值相同,
// 并 满足(table现有的结点的key和准备添加的key是同一个对象 || equals返回真)
// 就认为不能加入新的k-v
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)//如果当前的table的已有的Node 是红黑树,就按照红黑树的方式处理
e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
else {
//如果找到的结点,后面是链表,就循环比较
for (int binCount = 0; ; ++binCount) {//死循环
if ((e = p.next) == null) {//如果整个链表,没有和他相同,就加到该链表的最后
p.next = newNode(hash, key, value, null);
//加入后,判断当前链表的个数,是否已经到8个,到8个,后
//就调用 treeifyBin 方法进行红黑树的转换
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash && //如果在循环比较过程中,发现有相同,就break,就只是替换value
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value; //替换,key对应value
afterNodeAccess(e);
return oldValue;
}
}
++modCount;//每增加一个Node ,就size++
if (++size > threshold[12-24-48])//如size > 临界值,就扩容
resize();
afterNodeInsertion(evict);
return null;
}
5. 关于树化(转成红黑树)
//如果table 为null ,或者大小还没有到 64,暂时不树化,而是进行扩容.
//否则才会真正的树化 -> 剪枝
final void treeifyBin(Node[] tab, int hash) {
int n, index; Node e;
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
resize();
}
*/
}
}
存放的元素是键值对:即K-V
hashtable
的键和值都不能为null
,否则会抛出NullPointerException
hashTable
使用方法基本上和HashMap
一样
hashTable
是线程安全的(synchronized
), hashMap
是线程不安全的
比较
版本 | 线程安全(同步) | 效率 | 允许null键null值 | |
---|---|---|---|---|
Hashmap | 1.2 | 不安全 | 高 | 可以 |
Hashtable | 1.0 | 安全 | 较低 | 不可以 |
Properties类继承自 Hashtable 类并且实现了Map接口,也是使用一种键值对的形式来保存数据。
使用特点和Hashtable
类似。
Properties
还可以用于从xxx.properties
文件中,加载数据到Properties
类对象, 并进行读取和修改。
xxx.properties
文件通常作为配置文件
package com.hspedu.set_;
import java.util.Comparator;
import java.util.TreeSet;
@SuppressWarnings({"all"})
public class TreeSet_ {
public static void main(String[] args) {
//1. 当我们使用无参构造器,创建TreeSet时,仍然是无序的
//2. 希望添加的元素,按照字符串大小来排序
//3. 使用TreeSet 提供的一个构造器,可以传入一个比较器(匿名内部类)并指定排序规则
//4. 简单看看源码
/*
1. 构造器把传入的比较器对象,赋给了 TreeSet的底层的 TreeMap 的属性 this.comparator
public TreeMap(Comparator super K> comparator) {
this.comparator = comparator;
}
2. 在 调用 treeSet.add("tom"), 在底层会执行到
if (cpr != null) {//cpr 就是我们的匿名内部类(对象)
do {
parent = t;
//动态绑定到我们的匿名内部类(对象)compare
cmp = cpr.compare(key, t.key);
if (cmp < 0)
t = t.left;
else if (cmp > 0)
t = t.right;
else //如果相等,即返回0,这个Key就没有加入
return t.setValue(value);
} while (t != null);
}
*/
// TreeSet treeSet = new TreeSet();
TreeSet treeSet = new TreeSet(new Comparator() {
@Override
public int compare(Object o1, Object o2) {
//下面 调用String的 compareTo方法进行字符串大小比较
//return ((String) o2).compareTo((String) o1);
//如果要求加入的元素,按照长度大小排序
return ((String) o1).length() - ((String) o2).length();
}
});
//添加数据.
treeSet.add("jack");
treeSet.add("tom");// 3
treeSet.add("sp");
treeSet.add("a");
treeSet.add("abc");// 长度为3,加不进去
System.out.println("treeSet=" + treeSet);
}
}
package com.hspedu.map_;
import java.util.Comparator;
import java.util.TreeMap;
@SuppressWarnings({"all"})
public class TreeMap_ {
public static void main(String[] args) {
//使用默认的构造器,创建TreeMap, 是无序的(也没有排序)
/*
要求:按照传入的 k(String) 的大小进行排序
*/
// TreeMap treeMap = new TreeMap();
TreeMap treeMap = new TreeMap(new Comparator() {
@Override
public int compare(Object o1, Object o2) {
//按照传入的 k(String) 的大小进行排序
//按照K(String) 的长度大小排序
//return ((String) o2).compareTo((String) o1);
return ((String) o2).length() - ((String) o1).length();
}
});
treeMap.put("jack", "杰克");
treeMap.put("tom", "汤姆");
treeMap.put("kristina", "克瑞斯提诺");
treeMap.put("smith", "斯密斯");
treeMap.put("hsp", "韩顺平");//加入不了
System.out.println("treemap=" + treeMap);
/*
解读源码:
1. 构造器. 把传入的实现了 Comparator接口的匿名内部类(对象),传给给TreeMap的comparator
public TreeMap(Comparator super K> comparator) {
this.comparator = comparator;
}
2. 调用put方法
2.1 第一次添加, 把k-v 封装到 Entry对象,放入root
Entry t = root;
if (t == null) {
compare(key, key); // type (and possibly null) check
root = new Entry<>(key, value, null);
size = 1;
modCount++;
return null;
}
2.2 以后添加
Comparator super K> cpr = comparator;
if (cpr != null) {
do { //遍历所有的key , 给当前key找到适当位置
parent = t;
cmp = cpr.compare(key, t.key);//动态绑定到我们的匿名内部类的compare
if (cmp < 0)
t = t.left;
else if (cmp > 0)
t = t.right;
else //如果遍历过程中,发现准备添加Key 和当前已有的Key 相等,就不添加
return t.setValue(value);
} while (t != null);
}
*/
}
}
Collections
是一个操作 Set
、List
和 Map
等集合的工具类。
Collections
中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作。
排序操作(均为static 方法)
reverse(List)
反转List中元素的顺序
shuffle(List)
对List集合元素进行随机排序
sort(List)
根据元素的自然顺序对指定List集合元素按升序排序
sort(List,Comparator)
根据指定的Comparator产生的顺序对List 集合元素进行排序
swap(List,int,int)
将指定 list集合中的i处元素和j处元素进行交换
查找、替换
Object max(Collection)
根据元素的自然顺序,返回给定集合中的最大元素
Object max(Collection,Comparator)
根据Comparator指定的顺序,返回给定集合中的最大元素
Object min(Collection)
根据元素的自然顺序,返回给定集合中的最小元素
Object min(Collection,Comparator)
根据Comparator指定的顺序,返回给定集合中的最小元素
int frequency(Collection,Object
返回指定集合中指定元素的出现次数
void copy(List dest,List src)
将src中的内容复制到dest中
boolean replaceAll(List list,Object oldVal,Object newVal)
使用新值替换List 对象的所有旧值