最近偶然间看见一道名为史上最难的java面试题,这个题让了我对线程安全的有了一些新的思考,给大家分享一下这个题吧:
public class TestSync2 implements Runnable {
int b = 100;
synchronized void m1() throws InterruptedException {
b = 1000;
Thread.sleep(500); //6
System.out.println("b=" + b);
}
synchronized void m2() throws InterruptedException {
Thread.sleep(250); //5
b = 2000;
}
public static void main(String[] args) throws InterruptedException {
TestSync2 tt = new TestSync2();
Thread t = new Thread(tt); //1
t.start(); //2
tt.m2(); //3
System.out.println("main thread b=" + tt.b); //4
}
@Override
public void run() {
try {
m1();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
推荐大家先别急着看下面的答案,试着看看这个题的答案是什么?刚开始看这个题的时候,第一反应我擦嘞,这个是哪个老铁想出的题,如此混乱的代码调用,真是惊为天人。当然这是一道有关于多线程的题,最低级的错误,就是一些人对于.start()和.run不熟悉,直接会认为.start()之后run会占用主线程,所以得出答案等于:
main thread b=2000
b=2000
比较高级的错误:了解start(),但是忽略了或者不知道synchronized,在那里瞎在想sleep()有什么用,有可能得出下面答案:
main thread b=1000
b=2000
总而言之问了很多人,大部分第一时间都不能得出正确答案,其实正确答案如下:
main thread b=2000
b=1000
or
main thread b=1000
b=1000
解释这个答案之前,这种题其实在面试的时候遇到很多,依稀记得再学C++的时候,考地址,指针,学java的时候又在考i++,++i,"a" == b等于True? 这种题屡见不鲜,想必大家做这种题都知道靠死记硬背是解决不来的,因为这种变化实在太多了,所以要做这种比较模棱两可的题目,必须要会其意,方得齐解。尤其是多线程,如果你不知道其原理,不仅仅在面试中过不了,就算侥幸过了,在工作中如何不能很好的处理线程安全的问题,只能导致你的公司出现损失。
这个题涉及了两个点:
如果对这几个不熟悉的同学不要着急下面我都会讲,下面我解释一下整个流程:
情况A:有可能t线程已经在执行了,但是由于m2先进入了同步代码块,这个时候t进入阻塞状态,然后主线程也将会执行输出,这个时候又有一个争议到底是谁先执行?是t先执行还是主线程,这里有小伙伴就会把第3点拿出来说,肯定是先输出啊,t线程不是阻塞的吗,调度到CPU肯定来不及啊?很多人忽略了一点,synchronized其实是在1.6之后做了很多优化的,其中就有一个自旋锁,就能保证不需要让出CPU,有可能刚好这部分时间和主线程输出重合,并且在他之前就有可能发生,b先等于1000,这个时候主线程输出其实就会有两种情况。2000 或者 1000。
情况B:有可能t还没执行,tt.m2()一执行完,他刚好就执行,这个时候还是有两种情况。b=2000或者1000
6.在t线程中不论哪种情况,最后肯定会输出1000,因为此时没有修改1000的地方了。
整个流程如下面所示:
2.线程安全
对于上面的题的代码,虽然在我们实际场景中很难出现,但保不齐有哪位同事写出了类似的,到时候有可能排坑的还是你自己,所以针对此想聊聊一些线程安全的事。
2.1何为线程安全
我们用《java concurrency in practice》中的一句话来表述:当多个线程访问一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替执行,也不需要进行额外的同步,或者在调用方进行任何其它的协调操作,调用这个对象的行为都可以获得正确的结果,那这个对象就是线程安全的。
从上我们可以得知:
2.2线程安全性
我们可以按照java共享对象的安全性,将线程安全分为五个等级:不可变、绝对线程安全、相对线程安全、线程兼容、线程对立:
2.2.1不可变
在java中Immutable(不可变)对象一定是线程安全的,这是因为线程的调度和交替执行不会对对象造成任何改变。同样不可变的还有自定义常量,final及常池中的对象同样都是不可变的。
在java中一般枚举类,String都是常见的不可变类型,同样的枚举类用来实现单例模式是天生自带的线程安全,在String对象中你无论调用replace(),subString()都无法修改他原来的值
2.2.2绝对线程安全
我们来看看Brian Goetz的《Java并发编程实战》对其的定义:当多个线程访问某个类时,不管运行时环境采用何种调度方式或者这些线程将如何交替进行,并且在主调代码中不需要任何额外的同步或协同,这个类都能表现出正确的行为,那么称这个类是线程安全的。
周志明在<<深入理解java虚拟机>>中讲到,Brian Goetz的绝对线程安全类定义是非常严格的,要实现一个绝对线程安全的类通常需要付出很大的、甚至有时候是不切实际的代价。同时他也列举了Vector的例子,虽然Vectorget和remove都是synchronized修饰的,但还是展现了Vector其实不是绝对线程安全。简单介绍下这个例子:
public Object getLast(Vector list) {
return list.get(list.size() - 1);
}
public void deleteLast(Vector list) {
list.remove(list.size() - 1);
}
如果我们使用多个线程执行上面的代码,虽然remove和get是同步保证的,但是会出现这个问题有可能已经remove掉了最后一个元素,但是list.size()这个时候已经获取了,其实get的时候就会抛出异常,因为那个元素已经remove。
2.2.3相对安全
周志明认为这个定义可以适当弱化,把“调用这个对象的行为”限定为“对对象单独的操作”,这样一来就可以得到相对线程安全的定义。其需要保证对这个对象单独的操作是线程安全的,我们在调用的时候不需要做额外的操作,但是对于一些特定的顺序连续调用,需要额外的同步手段。我们可以将上面的Vector的调用修改为:
public synchronized Object getLast(Vector list) {
return list.get(list.size() - 1);
}
public synchronized void deleteLast(Vector list) {
list.remove(list.size() - 1);
}
这样我们作为调用方额外加了同步手段,其Vector就符合我们的相对安全。
2.2.4线程兼容
线程兼容是指其对象并不是线程安全,但是可以通过调用端正确地使用同步手段,比如我们可以对ArrayList进行加锁,一样可以达到Vector的效果。
2.2.5线程对立
线程对立是指无论调用端是否采取了同步措施,都无法在多线程环境中并发使用的代码。由于Java语言天生就具备多线程特性,线程对立这种排斥多线程的代码是很少出现的,而且通常都是有害的,应当尽量避免。
2.3如何解决线程安全
对于解决线程安全一般来说有几个办法:互斥阻塞(悲观,加锁),非阻塞同步(类似乐观锁,CAS),不需要同步(代码写得好,完全不需要考虑同步)
同步是指在多个线程并发访问共享数据时,保证共享数据在同一个时刻只被一条线程(或是一些,使用信号量的时候)线程使用。
2.3.1 互斥同步
互斥是一种悲观的手段,因为他担心他访问的时候时刻有人会破坏他的数据,所以他需要通过某种手段进行将这个数据在这个时间段给占为独有,不能让其他人有接触的机会。临界区(CriticalSection)、互斥量(Mutex)和信号量(Semaphore)都是主要的互斥实现方式。在Java中一般用ReentrantLock和synchronized 实现同步。 而实际业务当中,推荐使用synchronized,在第一节的代码其实也是使用的synchronized ,为什么推荐使用synchronized 的呢?
如果你在业务中需要等待可中断,等待超时,公平锁等功能的话,那你可以选择这个ReentrantLock。
当然在我们的Mysql数据库中排他锁其实也是互斥同步的实现,当加上排他锁,其他事务都不能进行访问其数据。
2.3.2 非阻塞同步
非阻塞同步是一种乐观的手段,在乐观的手段中他会先去尝试操作,如果没有人在竞争,就成功,否则就进行补偿(一般就是死循环重试或者循环多次之后跳出),在互斥同步最重要的问题就是进行线程阻塞和唤醒所带来的性能问题,而乐观同步策略解决了这一问题。
但是上面就有个问题操作和检测是否有人竞争这两个操作一定得保证原子性,这就需要我们硬件设备的支持,例如我们java中的cas操作其实就是操作的硬件底层的指令。
在JDK1.5之后,Java程序中才可以使用CAS操作,该操作由sun.misc.Unsafe类里面的compareAndSwapInt()和compareAndSwapLong()等几个方法包装提供,虚拟机在内部对这些方法做了特殊处理,即时编译出来的结果就是一条平台相关的处理器CAS之类,没有方法调用的过程,或者可以认为是无条件内联进去了
2.3.3 无同步
要保证线程安全,并不一定就要进行同步,两者没有因果关系。同步只是保障共享数据争用时的正确性手段,如果一个方法本来就不涉及共享数据,那它自然就无须任何同步措施去保证正确性,因此会有一些代码天生就是现场安全的。 一般分为两类:
public int sum(){
return 1+2;
}
例如这种代码就是可重入代码,但是在我们自己的代码中其实出现得很少
2.4线程安全的一些其他经验
上面写得都比较官方,下面说说从一些真实的经验中总结出来的:
毛主席曾说过:手里有粮,心里不慌。多多学习多线程知识,这个也是最重要的,当然可以关注我的账号来和共同进步。