深入底层了解Java并发机制系列之CPU缓存模型

Javaer都知道，我们在编译器上面编写的Java代码经过编译后会形成字节码，然后由类加载器加载到JVM中，JVM在执行字节码时，将它们转换成一条条的汇编指令，最终由CPU的寄存器来运行，在CPU执行这些汇编的过程中需要读取数据或者写入数据，但CPU能读取的数据只能来自计算机中的内存，随着科技的发展，像Intel的部分CPU频率特别是睿频后已经到达了4.3GHZ了，但内存发展就比较缓慢，比如顶级的内存就3600MHZ左右，因此就造成了CPU的处理速度已经远远超过了内存的访问速度，正常情况都是千倍的速度差距。

CPU缓存模型

因为速度差距过大的原因，如果还是采用CPU直接读取内存上面的数据，就会导致CPU资源严重的浪费！于是那些生产CPU的科技公司就设计出了，在CPU和内存之间增加一层缓存的方案，刚才刻意到京东查了一下，现在的CPU基本都是三级缓存了，L1 ，L2 ，L3 缓存，我从百度图片找来了两张图（如有侵权，请联系我，我马上删除）

CPU缓存模型

CPU缓存和内存访问速度对比图

通过这两张图，我们就可以更加直观地感受到CPU缓存和内存在访问上面的速度的差距了，至于CPU核心的计算速度，和他们相比又是另一个级别的差距了。

那么在有了CPU缓存之后，我们就可以在程序运行的过程中，先从内存拷贝一份数据到CPU缓存中，然后CPU计算都操作缓存里的数据，等执行完成的时候，再把缓存中的数据更新到内存里，从而增加CPU的使用效率。

CPU借助缓存和内存进行数据交互

在引入CPU缓存之后，主了提高CPU的使用效率之外，还带来了一个数据不一致的问题。比如i++这一个操作，在引入了CPU缓存之后，他具体的情况是这样的：

1:将内存中的i复制一份到CPU缓存当中
2:CPU核心读取CPU缓存中的i
3:对i执行+1操作
4:将更新后的i写回CPU缓存
5:将CPU缓存中的i更新到内存中

对于单线程来说，这完成不会有什么问题，但是对于多线程来说，就会出现错误了，因为每个线程都有自己的工作空间。比如，现在有线程A和线程B同时对i执行i++操作，我们假设i一开始为0，我们期望最后的结果是2，但是最后的结果可能1：比如:

1:线程A将内存中的i复制一份到CPU缓存当中，此时 i = 0;
2:线程B将内存中的i复制一份到CPU缓存当中，此时 i = 0;
3:线程A对应的CPU核心1读取CPU缓存中的i,并执行+1操作，然后把更新后的i写回CPU缓存(i=1)
4:线程B对应的CPU核心2读取CPU缓存中的i,并执行+1操作，然后把更新后的i写回CPU缓存(i=1)
5:线程A将CPU缓存中的i更新到内存(i=1)
6:线程B将CPU缓存中的i更新到内存(i=1)

出现这种情况的原因也是很简单的，比如多个CPU核心都从内存拷贝了一份数据到各自的缓存当中，然后直接拿缓存中的数据来执行+1操作，最后再把数据刷新内存，于是就造成了这个问题。由于Demo过于简单，我就不给出来了。下面我们回顾一下历史，看看这个问题是怎么被解决的，其实解决这个问题的方案有两种:

第一种是早期的方案，因为CPU和计算机的其他组件通信是通过总线来进行的，
比如数据通信就是通过数据总线来进行，如果一个CPU核心要操作某个数据了，
就通过向总线发送一个LOCK＃的信号来获取总线锁，那么其他CPU核心就被阻塞了，
从而只有一个CPU核心能对内存进行访问。

但是这种方案明显效率是比较低的，于是就提出了第二方案：

通过缓存一致性协议来解决数据不一致的问题，即CPU在操作CPU缓存中的数据时，
如果发现它是一个共享变量(其他CPU也缓存了一个副本)，那么他会进行以下的两种操作：
(1) 读操作，只会将数据单纯读到寄存器，不做额外处理
(2) 写操作，发出一个信号告诉其他CPU核心，你缓存的数据已经无效啦，让其他CPU在读取共享变量时，不得不重新去内存中重新拿过数据。

至此CPU缓存模型我们已经介绍的差不多了，下一篇我们去了解Java内存模型,有了CPU缓存模型和Java内存模型的知识,我们重新认识Java高并发又是另一种理解境界,下期见。

深入底层了解Java并发机制系列之CPU缓存模型

CPU缓存模型

你可能感兴趣的:(深入底层了解Java并发机制系列之CPU缓存模型)