简谈集合
Set
HashSet:最快获取元素方式,快速查找
TreeSet:按照比较结果的升序保存对象
List
ArrayList:随机访问元素速度快,在list中间插入删除操作慢
LinkedList:代价较低的在list中间进行插入和删除操作,提供了优化的顺序访问,随机访问相对较慢,特性比ArrayList大
LinkedList添加了使其用作栈,队列或双端队列的方法,实现Deque,Queue接口
Map
HashMap:最快的查找技术,没有按照任何明显顺序保存元素
TreeMap:按比较结果的升序保存键
一、List Set 区别
List 有序,可重复;
Set 无序,不重复;
二、List Set 实现类间区别及原理
Arraylist 底层实现使用Object[],数组查询效率高
扩容机制
- 1.6采用(capacity * 3)/ 2 + 1,默认容量为10;
- 1.7采用(capacity >> 2 + capacity)实现,位移动效率高于数学运算,右移一位等于乘以2倍;
读取速度快,写入会涉及到扩容,所以相对较慢。
LinkedList底层采用双向链表,只记录 first 和 last(LinkedList.Node);
Node记录 E item; Node
写入速度快,但是读取速度相对较慢;
HashSet 无序,不重复。
去重原理:所有值保存至HashMap的key中,利用HashMap的键不重复原理达到去重效果;
ArrayList去重可采用:new ArrayList(new HastSet(list));
TreeSet 有序,不重复。
底层采用TreeMap;
三、Map 实现原理及实现类对比
1. HashMap 线程不安全,无序
1) 内部保存以数组 HashMap.Entry
2) 线程不安全原因:
a 在数据操作方法上未采用synchronized同步标识,当多线程发生hash碰撞时,针对hash相等的key只会有一个能成功;
b 如果上面情况涉及到resize扩容情况,每个线程内都会对内部数组进行重新创建,但只有一个会成功;
3) 扩容(默认大小为16,2的四次方):
capacity = (capacity * 2 * loadFactor)
loadFactor:系数因子,默认为0.75,时间与空间的权衡结果
4) 可通过LinkedHashMap达到有序效果;
3. 建议优先考虑使用HashMap
- a. 单线程下效率高;
- b. 想排序可转换LinkedHashMap使用;
- c. 多线程下可采用 Collections.synchronizeMap(hashMap) 代替