适可而止,见好就收
来源主要是牛客的Java实习面经。下面的回答直接背就可以,需要一定的Java基础,适合春招实习的同学,但是我会在每个问题下把有助于理解的博客贴出来。如果发现有问题欢迎私聊我或留言我会在下面更新
腾讯19年秋招
这个题乍一看没有什么思路(因为Map是个集合,当然也有可能是我记错了),所以我们可以先介绍一下Map然后转到HashMap中
Map是一种使用键值对存储的集合。Map会维护与Key有关联的值。两个Key可以引用相同的对象,但Key不能重复,典型的Key是String类型,但也可以是任何对象。
在整个Map系列中,AbstractMap抽象类实现了Map,SortedMap接口继承了Map。而我们常用的HashMap,HashTable,TreeMap和ConcurrentHashMap有继承了AbstractMap类。
其中,HashTable和ConcurrentHashMap是线程安全的。前者是通过synchronized实现的,后者是通过AQS实现的。其中要注意HashTable不能存空值,HashMap是线程不安全的,key可以为空。TreeMap通过二叉树算法实现有序集合,它实现了SortedMap接口
阿里17年实习,小米19年秋招本科,滴滴19年秋招本科,网易19年秋招本科,bigo19年秋招本科,百度19年秋招本科
对于HashMap的构造函数来说,它有三个重要参数,分别是threshold,loadFactor和initialCapacity,根据阿里巴巴开发手册,由于默认的loadFactor是0.75,所以initialCapacity=(need/loadFactor)+1。而threshold=capacity*loadFactor。这也和阿里手册上的相对应。但是threshold在初始化时并不是容量和负载因子相乘,而是调用了一个tableSizeFor(int cap)
使得阈值大于或等于初始容量的最小2的幂
KeySet
对象,然后再通过KeySet 的迭代器KeyIterator
进行遍历。KeyIterator 类继承自HashIterator
类,再通过HashIterator#nextNode()进行遍历。HashIterator 的逻辑并不复杂,在初始化时,HashIterator 先从桶数组中找到包含链表节点引用的桶。然后对这个桶指向的链表进行遍历。遍历完成后,再继续寻找下一个包含链表节点引用的桶,找到继续遍历。找不到,则结束遍历V putVal(int, K, V, boolean, boolean)
方法执行核心逻辑
onlyIfAbsent
;如果桶中的引用类型为TreeNode,则调用红黑树的插入方法;如果桶中的引用为链表,则把值插入到链表尾结点,并检查链表长度,如果长度大于等于8,则把链表转为红黑树。之后再检查是否允许覆盖原值。最后一步是看size是否超过threshold,如果超过则用resize扩容Comparable
接口,则通过compareTo方法比较,否则通过仲裁方法比较。需要注意的是,虽然链表转换成了红黑树,但是都保留了在链表中每个节点的前置节点和后置节点。正因为如此,在红黑树拆分的中,对红黑树进行重新映射时,完全可以按照映射链表的方式进行。这样就避免了将红黑树转成链表后再进行映射,无形中提高了效率 。同时红黑树链化的时候直接转换成节点就成,方便了很多。我们需要注意,当桶(bucket)上的结点数小于6时树才转链表HashMap 的结构,为什么非线程安全,为什么容量是 2 的次幂
小米19年秋招本科
总体上,HashMap是数组+链表的形式。在JDK8中,当链表中元素数目超过8个,就会自动转为红黑树,进一步提高查找效率
(n - 1) & hash
来取模,(其中n-1是长度)。如果是容量是2次幂的话用&可以代替&,效率更高。同时再hash的过程中(h = key.hashCode()) ^ (h >>> 16)
会将原来的hash异或右移16位的hash,原因是因为当容量不超过16位时,也能利用上原来hash后的高位的值详细说一下 Hashmap 的 put 过程
pdd19年秋招本科
插入链表的时候是后插
关于put方法,前面原理有细说
1.7和1.8的区别
hash方法不同,8中使用了hashCode^hashCode>>>16,而7中只扰动了四次
put方法不同,7中只是链表,8中又加了红黑树。最主要的是8中引入了红黑树
扩容方式也不同,对于链表来说,JDK7扩容时是直接重新把元素hash之后put到新桶之中,而JDK8是先将链表分组,然后放到新桶之中。具体分组方式是计算节点的hash & oldCap
,如果为0则放入loHead和lotail中,反之则放入hiHead和hiTail中,之后把这两条分好组的链表放入新桶中
科大讯飞19年秋招本科
众所周知,Redis底层映射了一个大的数据表就是Hash,这个题超出了我的想象范围
pdd19年秋招本科
TreeMap在继承了AbstractMap的基础上,又实现了SortMap接口。所以TreeMap是按照一定规则排过序的。 它默认是按键值的升序排序,也可以指定排序的比较器,当用Iterator 遍历TreeMap时,得到的记录是排过序的。同时在JDK1.8中也是用的红黑树进行排序。同时,TreeMap的key不能为空,value可以为空。比较器Comparator要么在创建时指定,要么key需要实现Comparable接口的compareTo方法
HashMap因为没有排序所以要更快,它的key和value都可以为空
pdd19年秋招
afterNodeInsert()
,该方法会在节点处插入后删除一个节点,而要删除存活时间最长的节点的条件则通过我们自己覆盖方法removeEldestEntry
,我们可以根据节点数量判断是否移除最近最少被访问的节点,或者根据节点的存活时间判断是否移除该节点等字节跳动秋招,阿里19年实习,阿里19年秋招本科,pdd19年实习,滴滴19年秋招本科,bigo19年秋招本科
这个题即和集合相关,又和并发相关。并发中没有说,放到这里来细说
ConcurrentHashMap有一个特别的字段sizeCtl
,主要用来控制table的初始化和扩容的操作,不同的值有不同的含义。当为负数时:-1
代表正在初始化,-N代表有N-1
个线程正在 进行扩容;当为0
时:代表当时的table还没有被初始化;当为正数时:表示初始化或者下一次进行扩容的大小
对于JDK1.8来说,它每次锁只是锁了链表或者红黑树的头结点,大大地降低了锁的粒度。其基本的数据节点是Node,它就是一个链表,但是只允许对数据进行查找,不允许进行修改。TreeNode继承与Node,但是数据结构换成了二叉树结构,它是红黑树的数据的存储结构,用于红黑树中存储数据。TreeBin类用来封装TreeNode,提供转换黑红树的一些条件和锁的控制。和HashMap一样,ConcurrentHashMap是在第一次put的时候初始化容量的
在put时,会对当前的table进行无条件自循环直到put成功,可以分成以下六步流程来概述
initTable()
方法来进行初始化过程helpTransfer()
调用多线程一起扩容,真正的扩容方法是transfer()
,通过参数ForwardingNode
支持扩容操作,将已处理的节点和空节点置为ForwardingNode,并发处理时多个线程经过ForwardingNode就表示已经遍历了,就往后遍历对于get来说,可以分为三个步骤来描述
看过源码吗?说一下1.7和1.8的结构
总的来说,1.7和1.8有以下区别
为什么它是线程安全的
小米19年秋招本科
之所以是线程安全,1. 是因为在对ConCurrentHashMap进行操作时候是通过synchronized 和 CAS来保证的,它的锁粒度是针对于每一个Node节点的。2. 内部定义了一些静态变量如sizeCtl等来使多个线程检查是否正在初始化,如果在初始化则调用Thread.yield()
方法。3. 同时,对于扩容来说,如果hash之后等于MOVED,则在1.8中会使用多个线程来一起扩容,同时当在进行数组扩容的时候,如果当前节点还没有被处理(也就是说还没有设置为fwd节点),那就可以进行设置操作。如果该节点已经被处理了,则当前线程也会加入到扩容的操作中去。4. 对于put时,没有hash冲突,则使用CAS插入,如果产生hash冲突,则此时应该要加锁(锁的是链表或者红黑树的头结点)
synchronized
修饰,是表锁。(如果你要保证线程安全的话就使用 ConcurrentHashMap 吧!)tableSizeFor()
方法保证,下面给出了源代码)。也就是说 HashMap 总是使用2的幂作为哈希表的大小,后面会介绍到为什么是2的幂次方猪场19年秋招本科
Set是一种不允许重复的集合,不会有多个元素引用相同的对象。同时,从结构上来说,Set继承了Collection,和Collection有同样的方法。Set内部基本都是有Map实现的。主要有三种:
Set和List的区别
阿里19年秋招
HashSet的底层是基于HashMap实现的,除了 clone()
、writeObject()
、readObject()
是 HashSet 自己不得不实现之外,其他方法都是直接调用 HashMap 中的方法
HashSet检查重复的方法是: 当把对象加入HashSet
时,HashSet会先计算对象的hashcode
值来判断对象加入的位置,同时也会与其他加入的对象的hashcode值作比较,如果没有相符的hashcode,HashSet会假设对象没有重复出现。但是如果发现有相同hashcode值的对象,这时会调用equals()
方法来检查hashcode相等的对象是否真的相同。如果两者相同,HashSet就不会让加入操作成功,如果有一个不同,则加入成功
在将对象存储在 HashSet 之前,要先确保对象重写 equals()和 hashCode()方法,这样才能比较对象的值是否相等,以确保set中没有储存相等的对象。如果我们没有重写这两个方法,将会使用这个方法的默认实现,默认的hashCode比较的是对象的地址,这样对业务来说非常不友好
HashSet的应用场景
华为19年社招
快速查找并且唯一的集合场景
滴滴19年秋招本科
猪场19年秋招本科
网易19年秋招本科
ArrayList底层是用Object数组实现,有三个构造方法,一个有参,参数是初始容量。一个无参。最后一个是通过Collection集合构造。ArrayList的默认容量是10
对于插入来说,有两种方式,一种是在尾部插入,另一种是在指定位置插入。在尾部插入时,先检查是否扩容,然后再调用elementData[size++] = e
将元素插入数组的尾部;第二种情况是在指定位置插入时,先检查是否扩容,然后将index之后的所有元素向后移一位,最后将新元素插入index处
对于ArrayList的扩容机制来说,当空间用完*(minCapacity>element.length),其会按照原数组空间的1.5倍进行扩容(如果1.5倍还不够,就按明确要求的尺寸扩容)*。一般扩容之前需要调用add()
方法,首先调用了ensureCapacityInternal(size + 1)
。需要强调的是,如果我们已知将要插入大量数据时,可以先调用 ensureCapacity()
方法来提前扩大容量。
ArrayList还具有手动缩容的办法,如果在大量插入又大量删除之后,我们可以考虑调用trimToSize()
来缩容。
在ArrayList我们需要知道在add,toArray等方法中都用到了System.arraycopy()
和Arrays.copyOf()
方法
在调用add进行指定位置插入时会调用System.arraycopy()方法:System.arraycopy(elementData, index, elementData, index + 1, size - index);
elementData:源数组;index:源数组中的起始位置;elementData:目标数组;index + 1:目标数组中的起始位置; size - index:要复制的数组元素的数量;
在调用toArray方法的时候,会调用Object[] Arrays.copyOf(elementData, size);
方法。可以通过该方法对原数组进行扩容
Arrays.copyOf底层使用System.arraycopy()实现的 。arraycopy()
需要目标数组,将原数组拷贝到你自己定义的数组里或者原数组,而且可以选择拷贝的起点和长度以及放入新数组中的位置 copyOf()
是系统自动在内部新建一个数组,并返回该数组
华为19年社招
Collections.synchronizedList(list)
pdd19年秋招本科,京东19年秋招本科
LinkedList
不支持高效的随机元素访问,而 ArrayList
支持。快速随机访问就是通过元素的序号快速获取元素对象(对应于get(int index)
方法)滴滴19年秋招本科
根据第11题对ArrayList源码的分析,经常使用的方法有
add()
,先检查是否需要扩容,扩容时的miniCapacity为size+1,如果容量小于miniCapacity,则将容量扩大到1.5倍remove()
。如果参数是下标的话,则删除该下标的值,如果参数是元素的话,则删除指定元素,若元素重复,则只删除下标最小的元素toArray()
,底层通过System#arraycopy()
方法实现,这个方法贯穿了add,remove方法ensureCapacity()
,提前手动扩容,在插入大量数据之前使用trimToSize()
,手动缩容,在ArrayList中数组有大量浪费空间时使用滴滴19年秋招本科
这个题本应该在并发中说的,因为队列往往和线程池相关。线程池常用的三种阻塞队列是ArrayBlockingQueue,LinkedBlockingQueue和SynchronousQueue。BlockingQueue不接受空值
ArrayBlockingQueue
:基于数组的先进先出队列,此队列创建时必须指定大小LinkedBlockingQueue
:基于链表的先进先出队列,如果创建时没有指定此队列大小,则默认为Integer.MAX_VALUE
synchronousQueue
:这个队列比较特殊,它不会保存提交的任务,而是将直接新建一个线程来执行新来的任务queue里面都有什么方法
根据JDK11文档的描述:queue中的方法有四种形式,分别是抛出异常,返回特殊值,无限期阻塞当前队列知道操作成功,在放弃之前只阻塞给定的最大时间限制
Throws exception | Special value | Blocks | Times out | |
Insert | {add(e)} | {offer(e)} | {put(e)} | {offer(e, time, unit)} |
Remove | {remove()} | {poll()} | {take()} | { poll(time, unit)} |
Examine | {element()} | {peek()} | not applicable | not applicable |
常用的方法有offer
,put
,add
和poll
对于ArrayBlockingQueue来说,
手写下阻塞队列
这里还是让写生产者消费者模型,Java用的Condition实现的
public class MyBlockQueue {
//队列容器
private List<Integer> container = new ArrayList<>();
private Lock lock = new ReentrantLock();
//Condition
// 队列为空
private Condition isNull = lock.newCondition();
// 队列已满
private Condition isFull = lock.newCondition();
private volatile int size;
private volatile int capacity;
ZerahBlockQueue(int cap) {
this.capacity = cap;
}
public void add(int data) {
try {
lock.lock();
try {
while (size >= capacity) {
System.out.println("队列已满,释放锁,等待消费者消费数据");
isFull.await();
}
} catch (InterruptedException e) {
isFull.signal();
e.printStackTrace();
}
++size;
container.add(data);
isNull.signal();
} finally {
lock.unlock();
}
}
public int take(){
try {
lock.lock();
try {
while (size == 0){
System.out.println("阻塞队列空了,释放锁,等待生产者生产数据");
isNull.await();
}
}catch (InterruptedException e){
isFull.signal();
e.printStackTrace();
}
--size;
int res = container.get(0);
container.remove(0);
isFull.signal();
return res ;
}finally {
lock.unlock();
}
}
}
附Java集合容器思维导图