(特别的,cpu由于核心有限,往往是通过时分复用的方式实现并行多线程,会涉及大量的内存拷贝和上下文切换开销)不必要的锁竞争也会引起上下文切换
解决思路
可以使用Lmbench3测量上下文切换的时长 vmstat测量上下文切换次数
产生本质在于:
上述内容后面会仔细展开
如死锁问题
public class DeadLockDemo {
private static String resource_a = "A";
private static String resource_b = "B";
public static void main(String[] args) {
deadLock();
}
public static void deadLock() {
Thread threadA = new Thread(new Runnable() {
@Override
public void run() {
synchronized (resource_a) {
System.out.println("get resource a");
try {
Thread.sleep(3000);
synchronized (resource_b) {
System.out.println("get resource b");
}
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
});
Thread threadB = new Thread(new Runnable() {
@Override
public void run() {
synchronized (resource_b) {
System.out.println("get resource b");
synchronized (resource_a) {
System.out.println("get resource a");
}
}
}
});
threadA.start();
threadB.start();
}
}
避免死锁的方法:
同步方法调用一开始,调用者必须等待被调用的方法结束后,调用者后面的代码才能执行。而异步调用,指的是,调用者不用管被调用方法是否完成,都会继续执行后面的代码。
并发指的是多个任务交替进行,而并行则是指真正意义上的“同时进行”。
临界区用来表示一种公共资源或者说是共享数据,可以被多个线程使用。但是每个线程使用时,一旦临界区资源被一个线程占有,那么其他线程必须等待。
阻塞和非阻塞通常用来形容多线程间的相互影响,比如一个线程占有了临界区资源,那么其他线程需要这个资源就必须进行等待该资源的释放,会导致等待的线程挂起,这种情况就是阻塞,而非阻塞就恰好相反,它强调没有一个线程可以阻塞其他线程,所有的线程都会尝试地往前运行。
实际上java程序天生就是一个多线程程序,包含了:(1)分发处理发送给给JVM信号的线程;(2)调用对象的finalize方法的线程;(3)清除Reference的线程;(4)main线程
实现多线程的方式:
继承Thread
类,使用run
方法进行同步启动
public class MyThread extends Thread {
public void run() {
// ...
}
}
public static void main(String[] args) {
MyThread mt = new MyThread();
mt.start();
}
实现Runnable
接口,需要实现接口中的 run()
方法。使用start
方法进行异步启动。
public class MyRunnable implements Runnable {
@Override
public void run() {
// ...
}
}
public static void main(String[] args) {
MyRunnable instance = new MyRunnable();
Thread thread = new Thread(instance);
thread.start();
}
实现Callable
接口,需要实现接口中的 call()
方法。使用start
方法进行异步启动。与 Runnable
相比,Callable
可以有返回值,返回值通过 FutureTask
进行封装。
public class MyCallable implements Callable<Integer> {
public Integer call() {
return 123;
}
}
public static void main(String[] args) throws ExecutionException, InterruptedException {
MyCallable mc = new MyCallable();
FutureTask<Integer> ft = new FutureTask<>(mc);
Thread thread = new Thread(ft);
thread.start();
System.out.println(ft.get());
}
使用ExecutorService
的exec(runnable)
方法运行runnable
类
使用ExecutorService
的submit(runnable/callable)
,启动返回结果的线程,返回值为Future
,再调用get()
来获得结果。
Thread
和Runable
的区别和联系(看看就好):
Thread
类实现了Runable
接口。Run
方法。Runnable
的类更具有健壮性,避免了单继承的局限。Runnable
更容易实现资源共享,能多个线程同时处理一个资源。Thread
类会继承所有方法,开销较大问题:为什么我们调用start()
方法时会执行run()
方法,为什么我们不能直接调用run()
方法?
用start()
来启动线程 —> 异步执行
而如果使用run()
来启动线程 —> 同步执行
多线程就是为了并发执行,因此需要使用start
wait(),join(),LockSupport.lock()
方法线程会进入到WAITING(阻塞等待态)wait(long timeout),sleep(long),join(long),LockSupport.parkNanos(),LockSupport.parkUtil()
方法线程会进入到TIMED_WAITING,当超时等待时间到达后,线程会切换到READY的状态,等到CPU时间分片后就会转为RUNNINGObject.notify(),Object.notifyAll()
方法使线程转换到READY状态当线程进入到synchronized
方法或者synchronized
代码块时,线程切换到的是BLOCKED状态,而使用java.util.concurrent.locks
下lock
进行加锁的时候线程切换的是WAITING或者TIMED_WAITING状态,因为lock
会调用LockSupport
的方法。
其他线程可以调用该线程的interrupt()
方法对其进行中断操作,同时该线程可以调用 isInterrupted()
来感知其他线程对其自身的中断操作,从而做出响应。另外,同样可以调用Thread的静态方法 interrupted()
对当前线程进行中断操作,该方法会清除中断标志位。需要注意的是,当抛出InterruptedException
时候,会清除中断标志位,也就是说在调用isInterrupted
会返回false
。
一般在结束线程时通过中断标志位或者标志位的方式可以有机会去清理资源,相对于武断而直接的结束线程,这种方式要优雅和安全。
if(this.isInterrupted()){
close();//清理资源
}
如果一个线程实例A执行了threadB.join()
,其含义是:当前线程A会等待threadB线程终止后threadA才会继续执行。另外还提供了超时等待。
当threadB退出时会调用notifyAll()
方法通知所有的等待线程(join让进程进入waiting状态)。
Thread.sleep(millisec)
方法会休眠当前正在执行的线程,millisec
单位为毫秒。
sleep()
可能会抛出 InterruptedException
,因为异常不能跨线程传播回 main()
中,因此必须在本地进行处理。线程中抛出的其它异常也同样需要在本地进行处理。
public void run() {
try {
Thread.sleep(3000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
sleep()
VS wait()
:
sleep()
方法是Thread的静态方法,而wait()
是Object实例方法。wait()
方法必须要在同步方法或者同步块中调用(wait/notify
方法依赖于moniterenter
和moniterexit
)也就是必须已经获得对象锁。而sleep()
方法没有这个限制可以在任何地方种使用。另外,wait()
方法会释放占有的对象锁,使得该线程进入等待池中,等待下一次获取资源。而sleep()
方法只是会让出CPU并不会释放掉对象锁;sleep()
方法在休眠时间达到后如果再次获得CPU时间片就会继续执行,而wait()
方法必须等待Object.notift/Object.notifyAll
通知后,才会离开等待池,并且再次获得CPU时间片才会继续执行。这是一个静态方法,一旦执行,它会是当前线程让出CPU。
让出的CPU并不是代表当前线程不再运行了,如果在下一次竞争中,又获得了CPU时间片当前线程依然会继续运行,让出的时间片只会分配给当前线程相同优先级的线程。
在Java程序中,通过一个整型成员变量Priority
来控制优先级,优先级的范围从1~10
.在构建线程的时候可以通过setPriority(int)
方法进行设置,默认优先级为5,优先级高的线程相较于优先级低的线程优先获得处理器时间片。
守护线程是一种特殊的线程,就和它的名字一样,它是系统的守护者,在后台默默地守护一些系统服务,比如垃圾回收线程,JIT线程就可以理解守护线程。与之对应的就是用户线程,用户线程就可以认为是系统的工作线程,它会完成整个系统的业务操作。用户线程完全结束后就意味着整个系统的业务任务全部结束了,因此系统就没有对象需要守护的了,守护线程自然而然就会退。当一个Java应用,只有守护线程的时候,虚拟机就会自然退出。
public class DaemonDemo {
public static void main(String[] args) {
Thread daemonThread = new Thread(new Runnable() {
@Override
public void run() {
while (true) {
try {
System.out.println("i am alive");
Thread.sleep(500);
} catch (InterruptedException e) {
e.printStackTrace();
} finally {
System.out.println("finally block");
}
}
}
});
daemonThread.setDaemon(true);
daemonThread.start();
//确保main线程结束前能给daemonThread能够分到时间片
try {
Thread.sleep(800);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
这里需要注意的是守护线程在退出的时候并不会执行finally
块中的代码,所以将释放资源等操作不要放在finally
块中执行,这种操作是不安全的
前面说到,出现线程安全的问题一般是因为主内存和工作内存数据不一致性和重排序导致的。
在并发编程中主要需要解决两个问题:1. 线程之间如何通信;2.线程之间如何完成同步(这里的线程指的是并发执行的活动实体)。通信是指线程之间以何种机制来交换信息,主要有两种:共享内存和消息传递。
java内存模型是共享内存的并发模型,线程之间主要通过读-写共享变量来完成隐式通信。
哪些是共享变量
在java程序中所有实例域,静态域和数组元素都是放在共享内存中,而局部变量,方法定义参数和异常处理器参数不会在线程间共享。共享数据会出现线程安全的问题,而非共享数据不会出现线程安全的问题。关于JVM运行时内存区域在后面的文章会讲到。
JMM抽象结构模型
CPU的处理速度和主存的读写速度不是一个量级的,为了平衡这种巨大的差距,每个CPU都会有缓存。共享变量会先放在主存中,每个线程都有属于自己的工作内存,并且会把位于主存中的共享变量拷贝到自己的工作内存,之后的读写操作均使用位于工作内存的变量副本
线程A和线程B之间要完成通信的话,要经历如下两步:
为了提高性能,编译器和处理器常常会对指令进行重排序。
一般重排序可以分为如下三种:
double pi = 3.14 //A
double r = 1.0 //B
double area = pi * r * r //C
这是一个计算圆面积的代码,由于A,B之间没有任何关系,对最终结果也不会存在关系,它们之间执行顺序可以重排序。因此可以执行顺序可以是A->B->C或者B->A->C执行最终结果都是3.14,即A和B之间没有数据依赖性。
如果两个操作访问同一个变量,且这两个操作有一个为写操作,此时这两个操作就存在数据依赖性这里就存在三种情况:1. 读后写;2.写后写;3. 写后读,这三种操作都是存在数据依赖性的,如果重排序会对最终执行结果会存在影响。编译器和处理器在重排序时,会遵守数据依赖性,编译器和处理器不会改变存在数据依赖性关系的两个操作的执行顺序。
不管怎么重排序(编译器和处理器为了提供并行度),(单线程)程序的执行结果不能被改变。编译器,runtime
和处理器都必须遵守as-if-serial
语义。as-if-serial
语义把单线程程序保护了起来,遵守as-if-serial
语义的编译器,runtime
和处理器共同为编写单线程程序的程序员创建了一个幻觉:单线程程序是按程序的顺序来执行的。
JMM可以通过happens-before
关系向程序员提供跨线程的内存可见性保证。
as-if-serial
VS happens-before
:
as-if-serial
语义保证单线程内程序的执行结果不被改变,happens-before
关系保证正确同步的多线程程序的执行结果不被改变。as-if-serial
语义给编写单线程程序的程序员创造了一个幻境:单线程程序是按程序的顺序来执行的。happens-before
关系给编写正确同步的多线程程序的程序员创造了一个幻境:正确同步的多线程程序是按happens-before
指定的顺序来执行的。as-if-serial
语义和happens-before
这么做的目的,都是为了在不改变程序执行结果的前提下,尽可能地提高程序执行的并行度。具体的一共有8项规则:
happens-before
于该线程中的任意后续操作。(代码顺序)happens-before
于随后对这个锁的加锁。(syncronized
)volatile
变量规则:对一个volatile
域的写,happens-before于任意后续对这个volatile
域的读。A happens-before B
,且B happens-before C
,那么A happens-before C
。start()
规则:如果线程A执行操作ThreadB.start()
(启动线程B),那么A线程的ThreadB.start()
操作happens-before
于线程B中的任意操作。(先start再有线程的操作)join()
规则:如果线程A执行操作ThreadB.join()
并成功返回,那么线程B中的任意操作happens-before于线程A从ThreadB.join()
操作成功返回。interrupted()
方法的调用先行于被中断线程的代码检测到中断时间的发生。finalize
规则:一个对象的初始化完成(构造函数执行结束)先行于发生它的finalize(
)方法的开始。在设计JMM时需要考虑两个关键因素:
实际上:
happens-before
规则能满足程序员的需求。JMM的happens-before
规则不但简单易懂,而且也向程序员提供了足够强的内存可见性保证(有些内存可见性保证其实并不一定真实存在,比如上面的A happens-before B
)。volatile
变量只会被单个线程访问,那么编译器可以把这个volatile
变量当作一个普通变量来对待。这些优化既不会改变程序的执行结果,又能提高程序的执行效率。synchronized
可以用在方法上也可以使用在代码块中,其中方法是实例方法和静态方法分别锁的是该类的实例对象和该类的对象。而使用在代码块中也可以分为三种,具体的可以看上面的表格。这里的需要注意的是:如果锁的是类对象的话,尽管new
多个实例对象,但他们仍然是属于同一个类依然会被锁住,即线程之间保证同步关系。
执行同步代码块后首先要先执行monitorenter
指令,退出的时候monitorexit
指令.当线程获取monitor后才能继续往下执行,否则就只能等待。而这个获取的过程是互斥的,即同一时刻只有一个线程能够获取到monitor。
monitorenter
:
每个对象都有一个monitor
锁,包含线程持有者和计数器。
1.如果计数器为0,则该线程进入monitor,然后将计数器设置为1,该线程即为monitor的所有者。
2.如果线程已经占有该monitor,重新进入,则计数器加1.
3.如果其他线程已经占用了monitor,则该线程进入阻塞状态,直到计数器为0。
monitorexit
:
1. 指令执行时,monitor的进入数减1,如果减1后进入数为0,那线程退出monitor。
2. 其他被这个monitor阻塞的线程可以尝试去获取这个 monitor 的所有权。
通过这两段描述,我们应该能很清楚的看出Synchronized
的实现原理,Synchronized的语义底层是通过一个monitor的对象来完成,其实wait/notify
等方法也依赖于monitor
对象,这就是为什么只有在同步的块或者方法中才能调用wait/notify
等方法,否则会抛出java.lang.IllegalMonitorStateException
的异常的原因。
锁的重入性,即在同一锁程中,线程不需要再次获取同一把锁。Synchronized
先天具有重入性。每个对象拥有一个计数器,当线程获取该对象锁后,计数器就会加一,释放锁后就会将计数器减一。(再次进入计数器加1,计数器为0时释放)
对同一个监视器的解锁,happens-before于对该监视器的加锁
在图中每一个箭头连接的两个节点就代表之间的happens-before关系,黑色的是通过程序顺序规则推导出来,红色的为监视器锁规则推导而出:线程A释放锁happens-before线程B加锁,蓝色的则是通过程序顺序规则和监视器锁规则推测出来happens-befor关系,通过传递性规则进一步推导的happens-before关系。现在我们来重点关注2 happens-before 5,通过这个关系我们可以得出什么?
根据happens-before的定义中的一条:如果A happens-before B,则A的执行结果对B可见,并且A的执行顺序先于B。线程A先对共享变量A进行加一,由2 happens-before 5关系可知线程A的执行结果对线程B可见即线程B所读取到的a的值为1。
从整体上来看,线程A的执行结果(a=1)对线程B是可见的,实现原理为:释放锁的时候会将值刷新到主内存中,其他线程获取锁时会强制从主内存中获取最新的值。另外也验证了2 happens-before 5,2的执行结果对5是可见的。
从横向来看,这就像线程A通过主内存中的共享变量和线程B进行通信,A 告诉 B 我们俩的共享数据现在为1啦,这种线程间的通信机制正好吻合java的内存模型正好是共享内存的并发模型结构。
CAS
比较交换的过程可以通俗的理解为CAS(V,O,N)
,包含三个值分别为:V
内存地址存放的实际值;O
预期的值(旧值);N
更新的新值。当多个线程使用CAS操作一个变量是,只有一个线程会成功,并成功更新,其余会失败。失败的线程会重新尝试,当然也可以选择挂起线程。
在JDK1.5后虚拟机才可以使用处理器提供的CMPXCHG指令实现.
Synchronized VS CAS
元老级的Synchronized(未优化前)最主要的问题是:在存在线程竞争的情况下会出现线程阻塞和唤醒锁带来的性能问题(进入了内核态),因为这是一种互斥同步(阻塞同步)。而CAS并不是武断的间线程挂起,当CAS操作失败后会进行一定的尝试,而非进行耗时的挂起唤醒的操作,因此也叫做非阻塞同步。这是两者主要的区别。
被volatile修饰的变量能够保证每个线程能够获取该变量的最新值,从而避免出现数据脏读的现象。
在生成汇编代码时会在volatile修饰的共享变量进行写操作的时候会多出Lock
前缀的指令。
主要有这两个方面的影响:
在多处理器下,为了保证各个处理器的缓存是一致的,就会实现缓存一致性协议,每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了,当处理器发现自己缓存行对应的内存地址被修改,就会将当前处理器的缓存行设置成无效状态,当处理器对这个数据进行修改操作的时候,会重新从系统内存中把数据读到处理器缓存里。
黑色的代表根据程序顺序规则推导出来,红色的是根据volatile变量的写happens-before 于任意后续对volatile变量的读,而蓝色的就是根据传递性规则推导出来的。
从横向来看,线程A和线程B之间进行了一次通信,线程A在写volatile变量时,实际上就像是给B发送了一个消息告诉线程B你现在的值都是旧的了,然后线程B读这个volatile变量时就像是接收了线程A刚刚发送的消息。
原子性是指一个操作是不可中断的,要么全部执行成功要么全部执行失败,有着“同生共死”的感觉。及时在多个线程一起执行的时候,一个操作一旦开始,就不会被其他线程所干扰。我们先来看看哪些是原子操作,哪些不是原子操作,有一个直观的印象:
int a = 10; //1
a++; //2
int b=a; //3
a = a+1; //4
上面这四个语句中只有第1个语句是原子操作.
java内存模型中定义了8种操作都是原子的,不可再分的。
(重点)AtomicX
类型之所以能实现原子性,是因为其源码中实现了unsafe
类,而unsafe
类的方法里会使用CAS
方法(拿当前值与底层的值进行对比,如果相同则进行swap
操作)
AtomicInteger
类:
public final int getAndIncrement() {
return unsafe.getAndAddInt(this, valueOffset, 1);
}
Unsafe
类:
public final int getAndAddInt(Object var1, long var2, int var4) {
int var5;
do {
var5 = this.getIntVolatile(var1, var2);
} while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
return var5;
}
附:AtomicLong和LongAdder类:
补充知识:对于64位的long及double类型,jvm允许将64位的读/写操作 拆分成 两次32位的读/写操作。
LongAdder:经过一系列方法确保效率高,高并发时优先使用,但精度可能会下降。
AtomicLong:序列号生成这一类需要准确的数值时,使用AtomicLong
Atomic的ABA问题:
线程 1 从内存位置V中取出A。
线程 2 从位置V中取出A。
线程 2 进行了一些操作,将B写入位置V。
线程 2 将A再次写入位置V。
线程 1 进行CAS操作,发现位置V中仍然是A,操作成功。
尽管线程 1 的CAS操作成功,但不代表这个过程没有问题——对于线程 1 ,线程 2 的修改已经丢失。
解决方法:用AtomicStampedReference/AtomicMarkableReference (维护了一个“状态戳”)
当一个线程修改了共享变量时,另一个线程可以读取到这个修改后的值。
a)synchronize
:解锁前,把共享变量写入主内存。加锁时,清空工作内存中共享变量,确保从主内存中读到最新的值。(写对应释放锁,读对应加锁)
b)volatile
:保证可见性和禁止重排序
保证可见性:volatile写操作会把共享变量写入主内存。volatile读操作会从主内存中读到最新的值,然后放到工作内存中。
禁止重排序:不允许代码段内出现重排序。
!!!!(注意:对于volatile int count,在多线程环境下count++ 并不能保证线程安全)即volatile不具备原子性!!!!
不具备的原因:https://blog.csdn.net/xdzhouxin/article/details/81236356
实际上,volatile不适合计数,但很适合作为状态量的标识
synchronized
synchronized语义表示锁在同一时刻只能由一个线程进行获取,当锁被占用后,其他线程只能等待。因此,synchronized语义就要求线程在访问读写共享变量时只能“串行”执行,因此synchronized具有有序性。
volatile
在java内存模型中说过,为了性能优化,编译器和处理器会进行指令重排序;也就是说java程序天然的有序性可以总结为:如果在本线程内观察,所有的操作都是有序的;如果在一个线程观察另一个线程,所有的操作都是无序的。在单例模式的实现上有一种双重检验锁定的方式(Double-checked Locking)。代码如下:
public class Singleton {
private Singleton() {
}
private volatile static Singleton instance;
public Singleton getInstance(){
if(instance==null){
synchronized (Singleton.class){
if(instance==null){
instance = new Singleton();
}
}
}
return instance;
}
}
这里为什么要加volatile了?我们先来分析一下不加volatile的情况,有问题的语句是这条:
instance = new Singleton();
这条语句实际上包含了三个操作:1.分配对象的内存空间;2.初始化对象;3.设置instance指向刚分配的内存地址。但由于存在重排序的问题,可能有以下的执行顺序:
如果2和3进行了重排序的话,线程B进行判断if(instance==null)时就会为true,而实际上这个instance并没有初始化成功,显而易见对线程B来说之后的操作就会是错得。而用volatile修饰的话就可以禁止2和3操作重排序,从而避免这种情况。volatile包含禁止指令重排序的语义,其具有有序性。
(重要!背)AQS
依赖一条同步队列(FIFO
,由一个个Node
组成,双向链表),且维护一个volatile int
的共享资源state
。
state=0
表示同步状态可用(如果用于锁,则表示锁可用),state=1
表示同步状态已被占用(锁被占用)。
private volatile int state
2种同步方式:独占式,共享式。独占式如ReentrantLock
,共享式如Semaphore和CountDownLatch
模板方法模式:
tryAcquire(int arg)
: 独占式获取同步状态
tryRelease(int arg)
:独占式释放同步状态
tryAcquireShared(int arg)
:共享式获取同步状态
tryReleaseShared(int arg)
:共享式释放同步状态
用来控制一个或者多个线程等待多个线程。
(多线程运行,确保latch中的线程都执行完后其他线程才变成resume状态)
核心是维护一个计数器
①调用countDown()
让计数减1
②调用await()
等待计数变成0后,其他线程(本例中为主线程)变成resume
。
③await()
可以设置时间,达到时间就接着往下进行。
注意:以下代码中的test方法中都会等待1秒,以便实现线程的堵塞。
用来控制多个线程互相等待,只有当多个线程都到达时,这些线程才会继续执行。
和 CountdownLatch 相似,都是通过维护计数器来实现的。线程执行 await()
方法之后计数器会减 1,并进行等待,直到计数器为 0,所有调用 await()
方法而在等待的线程才能继续执行。
(多线程计算数据,最后合并结果)
当test方法里使用await()
的个数达到5个(即有五个线程ready
),这五个同时变成resume。
注:这里的await()
方法实际上用的就是Condition.await()
;
常用场景:达到个数时回滚,以及多线程计算数据,最后合并结果:
考题:Java中CyclicBarrier
和 CountDownLatch
有什么不同?
a)CountDownLatch
对外,CyclicBarrier
对内。前者是一组线程都countDown
后其他线程才能接着进行。而后者是内部多个线程相互等待,都ready
后再一起执行。
b)与 CyclicBarrier
不同的是,CountdownLatch
不能重新使用,CyclicBarrier 的计数器通过调用 reset()
方法可以循环使用。
Semaphore 类似于操作系统中的信号量,可以控制对互斥资源的访问线程数。
调用acquire()
和 release()
方法。先在构造函数中设置好资源数,当资源不够某个线程获取时,便进入堵塞状态。
tryAcquire()
:立即尝试获取资源 ,获取不到便丢弃线程并返回false。(下图中只会有3个线程执行,其余的线程因为获取不到资源被丢弃)
tryAcquire()
还可以带时间参数,表示多久
synchronized
关键字的实现也是悲观锁。对于互斥锁,如果资源已经被占用,资源申请者只能进入睡眠状态。但是自旋锁不会引起调用者睡眠,如果自旋锁已经被别的执行单元保持,调用者就一直循环在那里看是否该自旋锁的保持者已经释放了锁,“自旋”一词就是因此而得名。
重入锁的原理
a)和synchronize的原理一样都是使用计数器
b)ReentrantLock中的Sync实现了AQS,所以实际上是有一条同步队列来进行控制的。
性能上:
synchronized在资源竞争不是很激烈的情况下是很合适的。原因在于,编译程序通常会尽可能的优化synchronized,另外可读性非常好。 ReentrantLock: 当同步非常激烈的时候,ReentrantLock还能维持常态。
功能上:Synchronize有的ReentrantLock都有。但ReentrantLock有一些独有的功能:
a)可指定是公平锁还是非公平锁 (默认是非公平锁)
b)提供了Condition
类,可分组唤醒线程
c)lock.lockInterruptibly()
,允许在等待时由其它线程调用等待线程的Thread.interrupt
方法来中断等待线程的等待而直接返回,这时不用获取锁,而会抛出一个InterruptedException。
注:ReentrantLock的锁释放一定要在finally中处理,否则可能会产生严重的后果。
Condition 实现等待的时候内部是一个等待队列,包含着head节点和tail节点,等待队列中的每一个节点是一个 AbstractQueuedSynchronizer.Node 实例。
Condition 的本质就是等待队列和同步队列的交互:
当一个持有锁的线程调用 Condition.await()
方法,那么该线程会释放锁,然后构造成一个Node节点加入到等待队列的队尾。
当一个持有锁的线程调用 Condition.signal()
时,它会执行以下操作:
将等待队列队首的节点移到同步队列,然后对其进行唤醒操作。
分别有一个readLock和一个writeLock
readLock是共享锁,writeLock是排它锁,也就意味着:
1、读和读之间不互斥 (与非读写锁的区别就在这)
2、写和写之间互斥
3、读和写之间互斥(这个超级重要)
读写锁的锁降级概念:(获得读锁的特例)
LockSupport定义了一组以park开头的方法来阻塞当前线程,以及unpark方法来唤醒一个被阻塞的线程。
1.创建/销毁线程伴随着系统开销,过于频繁的创建/销毁线程,会很大程度上影响处理效率。(线程复用)
2.线程并发数量过多,抢占系统资源从而导致阻塞。(控制并发数量)
3.对线程进行一些简单的管理。(管理线程)
(1)线程复用:实现线程复用的原理应该就是要保持线程处于存活状态(就绪,运行或阻塞)
(2)控制并发数量:(核心线程和最大线程数控制)
(3)管理线程(设置线程的状态)
corePoolSize
:核心线程数
maximumPoolSize
:最大线程数(一般设置为INTMAX)
keepAliveSeconds
:空闲存活时间 (在corePoreSizeworkQueue
:阻塞队列,用来保存等待被执行的任务
corePoolSize
,则新建一个线程(核心线程)执行任务corePoolSize
,则将任务移入队列,等待空线程将其取出去执行 (通过getTask()
方法从阻塞队列中获取等待的任务,如果队列中没有任务,getTask
方法会被阻塞并挂起,不会占用cpu资源,整个getTask操作在自旋下完成)ThreadPoolExecutor.AbortPolicy
:丢弃任务并抛出RejectedExecutionException异常。
ThreadPoolExecutor.DiscardPolicy
:也是丢弃任务,但是不抛出异常。
ThreadPoolExecutor.DiscardOldestPolicy
:丢弃队列最前面的任务,然后重新尝试执行任务(重复此过程)
ThreadPoolExecutor.CallerRunsPolicy
:由调用线程处理该任务
CachedThreadPool()
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
根据源码可以看出:
这种线程池内部没有核心线程,线程的数量是有没限制的。
在创建任务时,若有空闲的线程时则复用空闲的线程,若没有则新建线程。
没有工作的线程(闲置状态)在超过了60S还不做事,就会销毁。
适用:执行很多短期异步的小程序或者负载较轻的服务器。
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
根据源码可以看出:
该线程池的最大线程数等于核心线程数,所以在默认情况下,该线程池的线程不会因为闲置状态超时而被销毁。
如果当前线程数小于核心线程数,并且也有闲置线程的时候提交了任务,这时也不会去复用之前的闲置线程,会创建新的线程去执行任务。如果当前执行任务数大于了核心线程数,大于的部分就会进入队列等待。等着有闲置的线程来执行这个任务。
适用:执行长期的任务,性能好很多。
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>()));
}
根据源码可以看出:
有且仅有一个工作线程执行任务,所有任务按照指定顺序执行,即遵循FIFO规则。
适用:一个任务一个任务执行的场景。
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
return new ScheduledThreadPoolExecutor(corePoolSize);
}
//ScheduledThreadPoolExecutor():
public ScheduledThreadPoolExecutor(int corePoolSize) {
super(corePoolSize, Integer.MAX_VALUE,
DEFAULT_KEEPALIVE_MILLIS, MILLISECONDS,
new DelayedWorkQueue());
}
根据源码可以看出:
DEFAULT_KEEPALIVE_MILLIS
就是默认10L
,这里就是10秒。这个线程池有点像是CachedThreadPool和FixedThreadPool 结合了一下。
不仅设置了核心线程数,最大线程数也是Integer.MAX_VALUE
。
这个线程池是上述4个中唯一一个有延迟执行和周期执行任务的线程池。
适用:周期性执行任务的场景(定期的同步数据)
总结:除了new ScheduledThreadPool 的内部实现特殊一点之外,其它线程池内部都是基于ThreadPoolExecutor类实现的。
execute()
方法实际上是Executor中声明的方法,在ThreadPoolExecutor进行了具体的实现,这个方法是ThreadPoolExecutor的核心方法,通过这个方法可以向线程池提交一个任务,交由线程池去执行。
submit()
,这个方法也是用来向线程池提交任务的,实际上它还是调用的execute()方法,只不过它利用了Future来获取任务执行结果。
shutdown()
不会立即终止线程池,而是要等所有任务缓存队列中的任务都执行完后才终止,但再也不会接受新的任务。
shutdownNow()
立即终止线程池,并尝试打断正在执行的任务,并且清空任务缓存队列,返回尚未执行的任务。
一般说来,线程池的大小经验值应该这样设置:(其中N
为CPU的个数)
如果是CPU密集型应用(CPU使用频率高,不适合频繁切换),则线程池大小设置为N+1
如果是IO密集型应用,则线程池大小设置为2N+1
一句话:每个线程内部都有一个ThreadLocalMap
,map中key为ThreadLocal自己(this),value为任意对象。对于不同的线程,threadLocal都是一样的,但value都是不同的。因此可以适合用来做线程数据隔离。
ThreadLocal类提供的几个方法:
get()
方法
public T get() {
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null) {
ThreadLocalMap.Entry e = map.getEntry(this);
if (e != null)
return (T)e.value;
}
return setInitialValue();
}
ThreadLocalMap getMap(Thread t) {
return t.threadLocals;
}
set()方法
public void set(T value) {
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null)
map.set(this, value);
else
createMap(t, value);
}
void createMap(Thread t, T firstValue) {
t.threadLocals = new ThreadLocalMap(this, firstValue);
}
remove()方法 (略)
初始容量16,负载因子2/3,解决冲突的方法是再hash法,也就是:在当前hash的基础上再自增一个常量进行哈希。
###应用场景
最常见的ThreadLocal使用场景为 用来解决数据库连接、Session管理等。
private static final ThreadLocal threadLocal = new ThreadLocal();
public static Session getSession() throws InfrastructureException {
Session s = (Session) threadLocal.get();
try {
if (s == null) {
s = getSessionFactory().openSession();
threadLocal.set(s);
}
} catch (HibernateException ex) {
throw new InfrastructureException(ex);
}
return s;
注意:以下队列的共性:
1.put()和take()是会阻塞的,而offer()和poll()是不会阻塞的。
2.并发都是通过ReentrantLock实现的。
3.阻塞是通过两个condition实现的(notEmpty和notFull)。
这里blocking的具体含义:
当队列中没有数据的情况下,消费者端会被自动阻塞(挂起),直到有数据放入队列。
当队列中填满数据的情况下,生产者端的所有线程都会被自动阻塞(挂起),直到队列中有空的位置,线程被自动唤醒。
put和take共用同一个ReentrantLock,也就意味着(put_put、take_take、put_take都互斥)。
并发是由ReentrantLock来实现,而阻塞是有lock的两个Condition来实现。
//仍然是有数组实现
final Object[] items;
//并发是由ReentrantLock来控制
final ReentrantLock lock;
//阻塞是有两个Condition来实现
private final Condition notEmpty;
private final Condition notFull;
//put方法会先加锁,操作完再解锁,如果阻塞进入await()
public void put(E e) throws InterruptedException {
checkNotNull(e);
final ReentrantLock lock = this.lock;
lock.lockInterruptibly();
try {
while (count == items.length)
notFull.await();
//enqueue里有signal操作
enqueue(e);
} finally {
lock.unlock();
}
}
public E take() throws InterruptedException {
final ReentrantLock lock = this.lock;
lock.lockInterruptibly();
try {
while (count == 0)
notEmpty.await();
//dequeue里有signal操作
return dequeue();
} finally {
lock.unlock();
}
}
错误:在线程1take空队列阻塞,然后牢牢占据着锁不放 -> 线程2尝试写到该队列会发生死锁。
原因在于如果进入阻塞(await)会先把锁释放!并不会占据着锁不放!
生产者端和消费者端分别采用了独立的锁来控制数据同步,也就意味着put和take之间是不互斥的。
同样,阻塞是通过两个Condition实现的。
//内部使用带next的Node来实现linked结构
static class Node<E> {
E item;
Node<E> next;
Node(E x) {
item = x; }
}
//读锁
private final ReentrantLock takeLock = new ReentrantLock();
//读阻塞
private final Condition notEmpty = takeLock.newCondition();
// 写锁
private final ReentrantLock putLock = new ReentrantLock();
//写阻塞
private final Condition notFull = putLock.newCondition();
只有一个锁,内部控制线程同步的锁采用的是公平锁。queue
中存储的类需要实现compare
方法。
双向队列,只有一个锁,两个condition
。
除此之外还有三种队列。
Segment
的概念,恢复成HashMap
的结构(bucket数组+链表+红黑树
),并发控制使用 Synchronized 和 CAS 来操作,整个看起来就像是优化过且线程安全的HashMap.CocurrentHashMap
(1.8)中get
操作为什么不加锁?CocurrentHashMap
(1.8)中put
操作为什么加锁?ConcurrentHashMap
而不使用hashtable
?Hashtable
的大小增加到一定的时候,性能会急剧下降,因为迭代时需要被锁定很长的时间。而ConcurrentHashMap
的锁粒度是HashEntry
,即便数组长度很长,也能保持比较好的性能。源码解析:
private final Node<K,V>[] initTable() {
Node<K,V>[] tab; int sc;
while ((tab = table) == null || tab.length == 0) {
//如果一个线程发现sizeCtl<0,意味着另外的线程执行CAS操作成功,当前线程只需要让出cpu时间片
if ((sc = sizeCtl) < 0)
Thread.yield();
//尝试用CAS将sizeCtl设置成-1,成功的话说明由该线程来进行初始化
else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
//设置成功,进行初始化
try {
if ((tab = table) == null || tab.length == 0) {
int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = tab = nt;
sc = n - (n >>> 2);
}
} finally {
sizeCtl = sc;
}
break;
}
}
return tab;
}
final V putVal(K key, V value, boolean onlyIfAbsent) {
if (key == null || value == null) throw new NullPointerException();
int hash = spread(key.hashCode());
int binCount = 0;
for (Node<K,V>[] tab = table;;) {
Node<K,V> f; int n, i, fh;
if (tab == null || (n = tab.length) == 0)
tab = initTable();
//关键在这一块!CAS操作的条件!
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
else if ((fh = f.hash) == MOVED)
tab = helpTransfer(tab, f);
//下面使用synchronize来插入链表或红黑树(代码略)
}
addCount(1L, binCount);
return null;
}
是一个单向队列,队列由Node组成
并发的确保:head和tail设置为volatile,Node中的item和next也设置为volatile。
private transient volatile Node<E> head;
private transient volatile Node<E> tail;
private static class Node<E> {
volatile E item;
volatile Node<E> next;
...
Node中操作节点数据的API,都是通过Unsafe机制的CAS函数实现的;例如casNext()是通过CAS函数“比较并设置节点的下一个节点”
不可变(Immutable)的对象一定是线程安全的,不需要再采取任何的线程安全保障措施。只要一个不可变的对象被正确地构建出来,永远也不会看到它在多个线程之中处于不一致的状态。多线程环境下,应当尽量使对象成为不可变,来满足线程安全。
不可变的类型:
对于集合类型,可以使用 Collections.unmodifiableXXX() 方法来获取一个不可变的集合。
public class ImmutableExample {
public static void main(String[] args) {
Map<String, Integer> map = new HashMap<>();
Map<String, Integer> unmodifiableMap = Collections.unmodifiableMap(map);
unmodifiableMap.put("a", 1);
}
}
Exception in thread "main" java.lang.UnsupportedOperationException
at java.util.Collections$UnmodifiableMap.put(Collections.java:1457)
at ImmutableExample.main(ImmutableExample.java:9)
Collections.unmodifiableXXX() 先对原始的集合进行拷贝,需要对集合进行修改的方法都直接抛出异常。
public V put(K key, V value) {
throw new UnsupportedOperationException();
}
synchronized 和 ReentrantLock。
CAS,atomicx
栈封闭
多个线程访问同一个方法的局部变量时,不会出现线程安全问题,因为局部变量存储在虚拟机栈中,属于线程私有的。
public class StackClosedExample {
public void add100() {
int cnt = 0;
for (int i = 0; i < 100; i++) {
cnt++;
}
System.out.println(cnt);
}
}
public static void main(String[] args) {
StackClosedExample example = new StackClosedExample();
ExecutorService executorService = Executors.newCachedThreadPool();
executorService.execute(() -> example.add100());
executorService.execute(() -> example.add100());
executorService.shutdown();
}
--------------------
100
100
ThreadLocal
可重入代码(Reentrant Code)
这种代码也叫做纯代码(Pure Code),可以在代码执行的任何时刻中断它,转而去执行另外一段代码(包括递归调用它本身),而在控制权返回后,原来的程序不会出现任何错误。
可重入代码有一些共同的特征,例如不依赖存储在堆上的数据和公用的系统资源、用到的状态量都由参数中传入、不调用非可重入的方法等。
给线程起个有意义的名字,这样可以方便找 Bug。
缩小同步范围,从而减少锁争用。例如对于 synchronized,应该尽量使用同步块而不是同步方法。
多用同步工具少用 wait() 和 notify()。首先,CountDownLatch, CyclicBarrier, Semaphore 和 Exchanger 这些同步类简化了编码操作,而用 wait() 和 notify() 很难实现复杂控制流;其次,这些同步类是由最好的企业编写和维护,在后续的 JDK 中还会不断优化和完善。
使用 BlockingQueue 实现生产者消费者问题。
多用并发集合少用同步集合,例如应该使用 ConcurrentHashMap 而不是 Hashtable。
使用本地变量和不可变类来保证线程安全。
使用线程池而不是直接创建线程,这是因为创建线程代价很高,线程池可以有效地利用有限的线程来启动任务。
关键:使用ReentrantReadWriteLock
class MyData{
//数据
private static String data = "0";
//读写锁
private static ReadWriteLock rw = new ReentrantReadWriteLock();
//读数据
public static void read(){
rw.readLock().lock();
System.out.println(Thread.currentThread()+"读取一次数据:"+data+"时间:"+new Date());
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
} finally {
rw.readLock().unlock();
}
}
//写数据
public static void write(String data){
rw.writeLock().lock();
System.out.println(Thread.currentThread()+"对数据进行修改一次:"+data+"时间:"+new Date());
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
} finally {
rw.writeLock().unlock();
}
}
}
kill -3
说明: pid: Java 应用的进程 id ,也就是需要抓取 dump 文件的应用进程 id 。
当使用 kill -3 生成 dump 文件时,dump 文件会被输出到标准错误流。假如你的应用运行在 tomcat 上,dump 内容将被发送到/logs/catalina.out 文件里。
dump文件示例:
"pool-1-thread-13" prio=6 tid=0x000000000729a000 nid=0x2fb4 runnable [0x0000000007f0f000]
java.lang.Thread.State: RUNNABLE
at java.net.SocketInputStream.socketRead0(Native Method)
at java.net.SocketInputStream.read(SocketInputStream.java:129)
at sun.nio.cs.StreamDecoder.readBytes(StreamDecoder.java:264)
at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:306)
at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:158)
- locked <0x0000000780b7e688> (a java.io.InputStreamReader)
at java.io.InputStreamReader.read(InputStreamReader.java:167)
at java.io.BufferedReader.fill(BufferedReader.java:136)
at java.io.BufferedReader.readLine(BufferedReader.java:299)
- locked <0x0000000780b7e688> (a java.io.InputStreamReader)
at java.io.BufferedReader.readLine(BufferedReader.java:362)
* 线程名称:pool-1-thread-13
* jvm线程id:tid=0x000000000729a000
* 线程状态:runnable
* 起始栈地址:[0x0000000007f0f000]
public static void main(String[] args)
{
Object lock1 = new Object();
Object lock2 = new Object();
ExecutorService exec = Executors.newCachedThreadPool();
exec.execute(() ->{
synchronized(lock1)
{
System.out.println("get lock1,want lock2...");
Thread.sleep(1000); //try-catch忽略
synchronized (lock2)
{
System.out.println("get lock2");
}
}
}
);
exec.execute(()->{
synchronized (lock2)
{
System.out.println("get lock2,want lock1....");
Thread.sleep(1000); //try-catch忽略
synchronized (lock1)
{
System.out.println("get lock1");
}
}
});
}
public class Depot
{
ReentrantLock lock = new ReentrantLock();
Condition notFull = lock.newCondition();
Condition notEmpty = lock.newCondition();
LinkedList<Integer> queue;
int limit;
public Depot(int limit)
{
queue = new LinkedList<>();
this.limit = limit;
}
public void produce(int i)
{
lock.lock();
try
{
// System.out.println("生产" + i);
//满了阻塞
if(queue.size() == limit)
// {
// System.out.println("队列已满,进入阻塞");
notFull.await();
// System.out.println(i+ "已被唤醒");
// }
queue.offer(i);
notEmpty.signal();
}catch(Exception e)
{
e.printStackTrace();
}
finally
{
lock.unlock();
}
}
public int consume()
{
int num = -1;
lock.lock();
try
{
//空了阻塞
if(queue.size() == 0)
// {
// System.out.println("队列已空,进入阻塞");
notEmpty.await();
// System.out.println("已被唤醒");
// }
num = queue.poll();
// System.out.println("消费:"+num);
notFull.signal();
}catch(Exception e)
{
e.printStackTrace();
}
finally
{
lock.unlock();
}
return num;
}
}
public static void main(String[] args)
{
ExecutorService exec = Executors.newCachedThreadPool();
Depot depot = new Depot(5);
for(int i = 0; i < 3; i++)
{
final int num = i;
exec.execute(()->
{
depot.produce(num);
});
}
try
{
Thread.sleep(200);
}
catch (InterruptedException e)
{
// TODO Auto-generated catch block
e.printStackTrace();
}
for(int i = 0; i < 7; i++)
{
final int num = i;
exec.execute(()->
{
depot.consume();
});
}
try
{
Thread.sleep(200);
}catch (InterruptedException e)
{
// TODO Auto-generated catch block
e.printStackTrace();
}
for(int i = 0; i < 3; i++)
{
final int num = i;
exec.execute(()->
{
depot.produce(num);
});
}
}
//调用三个任务,要求200ms内返回结果或者空
public class 两百秒内返回结果或者空
{
public static void main(String[] args)
{
ExecutorService exec = Executors.newCachedThreadPool();
Future<Integer> future1 = exec.submit(new MyTask());
Integer i1 = future1.get(200,TimeUnit.MILLISECONDS);
if(i1 == null)
System.out.println("null");
else
System.out.println(i1);
}
}
class MyTask implements Callable<Integer>
{
@Override
public Integer call() throws Exception
{
int sum = 0;
for(int i = 0;i < 100; i++)
{
sum+=i;
}
Thread.sleep(300);
return sum;
}
}