面试集2

1. Java线程的状态

Java线程在某个时刻只能处于以下六个状态中的一个。

New（新创建），一个线程刚刚被创建出来，还没有开始运行的状态，更通俗点说：还没有调用start方法； – Runnable（可运行），可以在Java虚拟机中运行的状态；一个可运行的线程可能正在运行自己的代码也可能没有，这取决于操作系统提供的时间片；
Blocked（被阻塞），当一个线程试图获取一个内部的对象锁（不是java.util.concurrent库中的锁），而该锁此时正被其他线程持有，则该线程进入阻塞状态；
Waiting（等待），当线程等待另一个线程通知调度器一个条件时，它自己进入等待状态。在调用Object.wait方法或Thread.join方法，或者是等待java.util.concurrent库中的Lock或Condition时，就会出现这种情况；
Timed waiting（计时等待），Object.wait、Thread.join、Lock.tryLock和Condition.await等方法有超时参数，还有Thread.sleep方法、LockSupport.parkNanos方法和LockSupport.parkUntil方法，这些方法会导致线程进入计时等待状态，如果超时或者出现通知，都会切换会可运行状态；
Terminated（被终止），因为run方法正常退出而死亡，或者因为没有捕获的异常终止了run方法而死亡。

Java线程状态.png

参考资料： – Java Platform SE 8文档 – Java核心技术卷I—P634

2. 进程与线程的区别，进程间如何通讯，线程间如何通讯？

在并发编程领域，有进程和线程两个概念，在Java语言中说起并发编程，常常是指多线程，但是了解进程的概念也非常重要：

进程是操作系统的资源调度实体，有自己的内存地址空间和运行环境；
线程一般被称为轻量级的进程，线程和进程一样，也有自己的运行环境，但是创建一个线程要需要的资源比创建一个进程要少。线程存在于进程之中——每个进程至少有一个线程。一个进程下的多个线程之间可以共享进程的资源，包括内存空间和打开的文件。
进程跟程序（programs）、应用（applications）具备相同的含义，进程间通讯依靠IPC资源，例如管道（pipes）、套接字（sockets）等； – 线程间通讯依靠JVM提供的API，例如wait方法、notify方法和notifyAll方法，线程间还可以通过共享的主内存来进行值的传递；
参考资料： – Oracle Java Doc——进程和线程

3. HashMap的数据结构是什么？如何实现的？和HashTable、ConcurrentHashMap的区别？

在Java 8中，HashMap的数据结构是由Node作为元素组成的数组：

（1）如果有多个值hash到同一个桶中，则组织成一个链表，而且，当这个链表的节点个数超过某个值（TREEIFY_THRESHOLD参数指定）时，则将这个链表重构为一个二叉树；

（2）如果发现map中的元素个数超过了threshold，则进行空间扩容——二倍空间。

HashMap和HashTable的数据结构和操作基本相同，区别是前者是非线程安全，并且HashMap接受value为null。
ConcurrentHashMap和HashTable一样，都是线程安全的，但是区别是：HashTable每次操作都会锁住整个表结构——导致一次只能有一个线程访问HashTable对象，而ConcurrentHashMap不会，只会锁住某个节点，只有在涉及到size的操作时才会锁整个表结构。
参考资料：《Java并发编程实战》

4. Cookie和Session的区别 HTTP是无状态协议，但是在实际应用中有跟踪客户端状态的需求，Cookie和Session是两种不同的实现方案。

Cookie保存在客户端，Session保存在服务端
Cookie没有Session安全，侵入者可以通过分析客户端的cookie信息侵入网站；
使用Session存储重要信息，使用Cookie存储不那么重要的信息；
使用Session方案时，常常需要依赖Cookie传递SID的值，如果客户端禁用了Cookie，则转而采取URL重写技术（但是这种技术有安全风险）；
参考资料：What is the difference between Sessions and Cookies in PHP?

5. 索引有什么用？如何建索引？

索引的作用：索引是一种数据结构，用于加快mysql获取数据的速度；
如何建索引？在使用InnoDB引擎的前提下讨论：（1）最左前缀原理：分析业务中的查询条件，区分度高的字段放在前面，尽量减少一条SQL的影响行数；（2）A+B可以代替A，A+B+C可以代替A+B，如果查询是A+C则只能使用到A列索引；关于InnoDB的认识：InnoDB使用B+Tree作为存储数据结构，属于聚簇索引，每个辅助索引最后都会指向主键的值，每次查询两次；（4）由于聚簇索引的特性，建议在使用InnoDB引擎的时候，使用自增ID作为主键，不要使用随机的业务列作为主键。

参考资料曹神的文章：如何应对索引
MySQL索引背后的数据结构及算法原理

6. ArrayList是如何实现的，ArrayList和LinkedList的区别？ArrayList如何实现扩容？

可变数组实现了List接口的所有操作，功能上跟Vector相同，区别是Vector是线程安全的；
区别：LinkedList实现了List和Deque接口，一般称为双向链表；LinkedList在插入和删除数据时效率更高，ArrayList在查找某个index的数据时效率更高；LinkedList比ArrayList需要更多的内存；
关于可变数组的扩容策略，可以查看源码，不同的JDK实现不太一样，我这里使用JDK 8：首先尝试扩容为原来大小的二倍，如果newCapacity还不够大，则再扩大为minCapacity值；如果newCapacity比数组的规定最大容量还大，则根据minCapacity的值进行定夺，参见hugeCapacity方法。


    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

在代码中，如果预先知道需要增加大量元素，则可以提前对当前的可变数组调用ensureCapacity方法，可以避免多次递增的内存重新分配；
参考资料：Java 8 DOC-LinkedList
Java 8 DOC-ArrayList
JDK 1.8中ArrayList的源码

7. equals、hashcode等Object类中一些方法的讨论？

覆写equals方法的时候，也必须覆写hashcode方法；
编写equals方法后，检查是否符合：对称性、传递性、一致性、自反性和非空性
参考资料《Effective Java 中文第二版》
Java doc – Object#equals

8. 面向对象

三大特性封装
继承
多态

9. JVM如何加载字节码文件？

虚拟机把描述类的数据从Class文件加载到内存，并对数据进行校验、转换解析和初始化，最终形成可被虚拟机直接使用的Java类型，这就是虚拟机的类加载机制。
Java语言中类的加载、连接和初始化过程都是在程序运行期间完成的，领Java具备高度的灵活性。
类加载的过程：加载、连接（验证、准备、解析）、初始化。 – 加载：通过一个类的名字获取此类的二进制字节流（PS：不限于从文件中读取）；将这个字节流代表的静态存储结构转换为方法区的运行时结构（由具体的虚拟机自己定义）；在内存中生成一个java.lang.Class对象，作为方法区这个类的各种数据结构的访问入口。 – 验证：文件格式验证、元数据验证（语义分析，类与类的继承关系等）、字节码验证（数据流和控制流分析）、符号引用验证（对类自身以外的信息进行匹配校验） – 准备：正式为类变量分配内存并设置初始值，这里类变量指的是被static修饰的变量。例外：如果类字段是常量，则在这里会被初始化为表达式指定的值。 – 解析：将常量池内的符号引用替换为直接引用。符号引用：类似于OS中的逻辑地址；直接引用：类似于OS中的物理地址，直接指向目标的指针、相对偏移量或一个能间接定位到目标的句柄。 – 初始化：真正开始执行类中定义的Java程序代码；初始化用于执行Java类的构造方法。类初始化的过程是不可逆的，如果中间一步出错，则无法执行下一步，参见不可逆的类初始化过程。

10. GC算法

垃圾回收解决三个问题：哪些内存需要回收？什么时候回收？如何回收？
垃圾回收关注的是堆内存（heap）；
常见的垃圾收集算法标记-清除算法
复制算法
标记-整理算法
分代收集算法

11. 什么情况下回出现Full GC，什么情况下会出现Young GC

对象优先在新生代Eden区中分配，如果Eden区没有足够的空间时，就会触发一次young gc
Full gc的触发条件有多个，FULL GC的时候会STOP THE WORD。在执行Young gc之前，JVM会进行空间分配担保——如果老年代的连续空间小于新生代对象的总大小（或历次晋升的平均大小），则触发一次full gc。
显式调用System.gc()方法时；
大对象直接进入老年代，从年轻代晋升上来的老对象，尝试在老年代分配内存时，但是老年代内存空间不够；

12. JVM内存模型

JVM内存模型

– Java虚拟机规范定义Java内存模型，尝试屏蔽掉各种硬件和操作系统的访问差异； – JVM内存模型的目标：定义程序中各个变量的访问规则，即在虚拟机中将变量存储到内存和从内存取出来这样的细节； – volatile关键字：当一个变量用volatile关键字限定后，会有两个语义：（1）当这个变量的值被修改后，会立即刷新到主内存中，对其他线程可见；当某个线程读取这个变量的时候，也会重新将主内存中的数据刷一份到工作内存中来。但是，如果多线程操作这个变量的计算中，后一个值依赖前一个值，就还是会有并发问题，说明volatile不具备原子性；（2）禁止指令重排优化，观察voatile变量对应的字节码文件，会发现变量的操作指令后面加了一句lock addl $0x0,(%esp)
的操作，这个操作相当于一个内存屏障。 – synchronized关键字：当一个线程对一个变量加锁的时候，就会清空这个变量在当前工作内存中的值，因此该关键字同时满足了可见性和原子性。 – 参考资料 – 程晓明：深入理解JVM内存模型1 – 《深入理解JVM虚拟机》 – 《Java并发编程实战》

13. Java运行时数据区

Java虚拟机运行时数据区

– 程序计数器（PC）：Java线程私有，类似于操作系统里的PC计数器，用于指定下一条需要执行的字节码的地址； – Java虚拟机栈：Java线程私有，虚拟机展描述的是Java方法执行的内存模型：每个方法在执行的时候，都会创建一个栈帧用于存储局部变量、操作数、动态链接、方法出口等信息；每个方法调用都意味着一个栈帧在虚拟机栈中入栈到出栈的过程； – 本地方法栈：和Java虚拟机栈的作用类似，区别是该该区域为JVM调用到的本地方法服务； – 堆（Heap）：所有线程共享的一块区域，垃圾收集器管理的主要区域。目前主要的垃圾回收算法都是分代收集，因此该区域还可以细分为如下区域： – 年轻代 – Eden空间 – From Survivor空间1，From Survivor空间2，用于存储在Young gc过程中幸存的对象； – 老年代 – 方法区：各个线程共享的一个区域，用于存储虚拟机加载的类信息、常量、静态变量等信息； – 运行时常量池：方法区的一部分，用于存放编译器生成的各种字面量和符号引用；

14. 事务的实现原理

事务的特性：ACID——原子性、一致性、隔离性和持久性
Spring中的事务管理？Spring事务管理那些事
MySQL中的事务？事务的隔离级别和锁，参考何登成的MySQL的加锁处理分析