Java多线程之有序性(一)

学识甚浅,大家仅作参考吧。
对于初学者来书,这一章涉及到的知识点很多,在这之前,我总结几点重要的知识点:
1.Java内存模型。为什么内存模型这么重要?其实细想一下,多线程和单线程相比,出现问题不就是内存里面的值可能与预期值(单线程运行/串行运行)之间不一致嘛。所以一定至少要知道读写操作是怎么操作内存的!!
2.Java程序的运行顺序。程序是如何按照happen-before原则运行的。
3.Java重排序
4.本章内容做一个假设,即每个线程运行在自己的处理器上,不考虑基于时间片分时实现的多线程,即我们这章讨论的多线程是指不同的处理器上的线程。(因为基于时间片分时的多线程也就是单一处理器的多线程在有序性上讨论起来很麻烦,大家可以参考Java多线程编程指南,也可以留言)

前两点基础大家上网查查,我主要讲一下导致并发问题的第三点。先明白几个概念:
源代码顺序:源代码中所指定的内存访问操作顺序。
程序顺序:我们可以理解为编译得到机器码或者解释执行的字节码(之后把两者统称为字节码)所指定的内存访问顺序。
执行顺序:内存访问在指定处理器上的实际执行顺序。
感知顺序:给定处理器感知到其他处理器内存访问的顺序。

有点难度的东西来了,看不下去就一点一点看吧=o=
在此基础上我们将重排序分为两部分:指令重排序存储子系统重排序
指令重排序:表现在 程序顺序与源代码顺序不一致 或者 执行顺序与程序顺序 不一致。
解释一下就是:源代码中指定的内存访问顺序与得到的字节码顺序不一样 或者 字节码顺序与实际的执行顺序不一样。
既然产生了不一样,那么问题肯定是出在连接这三个过程的中间件上面。学过java的同学应该知道,java平台包括两种编译器:
静态编译器(javac)和动态编译器(jit:just in time)。静态编译器是将.java文件编译成.class文件(二进制文件),之后便可以解释执行。动态编译器是将.class文件编译成机器码,之后再由jvm运行。jit主要是做性能上面的优化,如热点代码编译成本地代码,加速调用。(说点题外话,这些东西本来应该在课上就应该学到的,但是......诶)好的,那么指令重排序的根源主要在哪呢?
其实javac基本不会调整指令顺序,调整指令顺序的大多出在jit优化上。
有没有人想问,既然jit优化会出问题,那么为什么还要这个优化啊!!(我觉得能问出问题起码跟上了)
在单线程情况下,我们并不在乎具体的内存访问顺序是什么样的,只要展示出来的结果是按照我的源代码顺序执行的就好了,我不会管你究竟在我的字节码或者机器码中调整了怎样的顺序。 也就是说,编译器的优化它并不会造成结果的偏差,但是带来的性能的提升确实巨大的,就好像你的mysql用了索引和没用索引一样,代码量上去之后,优化就是必须的。
所以,问题就出在了并发访问时,你一旦调整了指令顺序,而且又在没有同步的情况下,那么我的一个线程就很可能读到另一个线程操作的中间过程。给大家举个例子(第一章提到的初始化问题):
Person p = new Person();那么我们的Jit编译器会怎样操作呢?会分为以下三个子操作,
①.分配Person实例所需要的内存空间;
objRef = allocate(Person.class);(推荐大家看一下Java反射机制,很重要的很基础的很...有用的=@=)
②.调用Person的构造方法初始化objRef引用指向一个Person实例;
invokeConstructor(objRef);
③.将Person实例引用objRef赋值给实例变量p;
p = objRef;
在优化的时候,我们很可能将操作③调整到操作②之前进行,也就是先将一个空的实例赋给p。那么多线程访问的时候,其它线程很可能用这个空的实例,从而造成错误。

存储子系统重排序:表现在感知顺序与执行顺序不一样。
首先我们要明确一下什么是存储子系统:简单理解就是主存与寄存器之间的高速缓存,细一点的话可以加上写缓冲器(提高写主存的效率)。
假设我们两个内存访问操作都是严格按照程序顺序执行的,即不发生指令重排的情况,在存储子系统的作用下也会造成其他处理器(线程) 感知到 这两个内存访问操作的顺序不一样。那么,这两个操作可以有四种:其实就是读操作和写操作的排列组合。
以读写操作为例:在重排序的作用下,会让其他线程感觉读操作被排到了写操作之后。
但是可能还是不太清楚,考虑两个线程P1和P2,它们有两个共享变量data(int)和ready(boolean),P1的任务是更新data并将ready变为true,P2的任务是不断轮询ready的值,当ready为true时打印出data的值。现在P1更新了data,并将ready置为true,并在无指令重排的情况下把值都放到写缓冲区。但是,写缓冲区并不保证操作的先入先出原则,即可能先把ready的值更新回高速缓存(或主存),然后再把data值写回。那么在两个操作之间,P2可能看见了ready为true,而此时data的新值还在写缓存中,并未更新回去,就造成了错误。

东西其实还蛮多的,大家细细体会,下一章我们再具体讨论有序性。

你可能感兴趣的:(Java多线程之有序性(一))