Java高级之内存模型分析


博客出自:http://blog.csdn.net/liuxian13183,转载注明出处! All Rights Reserved !

下文是博主感悟,请带着怀疑性的态度阅读!

需要了解基本变量所占内存大小,请移步:读书笔记-类结构的认识

Java存储空间有这么几块-来源于Java编程思想

寄存器:位于处理器内部,不受外层代码控制,由处理器自行分配-C/C++可以建议分配方式

堆栈:位于RAM中  引用基本数据类型存放的区块。 指针向下生成新对象,向上释放对象(new关键字)

堆:位于RAM中 对象存放的区块

常量存储:位于ROM中 存放于方法体中

非RAM存储:流对象和持久化数据-存储到硬盘

说到存储就难免讲到JVM的垃圾回收机制,需要了解的同学可以点进去看看


如果要实现处理器的高效率,那么就要压榨它的每一寸(byte)的运行能力,I3的处理器达到3.4GHz,即每秒运算3.4亿次,因此给它划分任务块,每块分配足够多的任务,实现高并发;所以对内存的模型需要详细了解。


由于硬件的读写速度与处理器的运算速度差距过大,一般都会写一层高速缓存来作为缓冲,一边从硬盘读数据到缓存,一边把处理器的处理结果写入缓存,一边把缓存中要写入的数据写到硬盘;因此很多程序会使用到中间件。


如果多个处理器同时处理缓存,就需要拟定协议谁先谁后,对于同一个处理器中的任务也是同样如此,有sychronzied关键字来处理;同时处理器还会对一段程序丧心病狂的进行(OOOE)乱序处理,也就是顺序在前面的代码并不一定先执行,对于依赖前段程序结果的代码来说,就需要通过其他途径来保证顺序性。


内存模型定义的关键在于第一使各处理器的操作不具有歧义 第二不影响拓展各自的特性;它主要定义虚拟机存取数据的细节,定义所有变量都存储在主内存,每条线程都有自己的工作内存(主内存的副本,或者叫引用),不同线程的工作内存互不直接访问,通过主内存来影响各自对值的引用;拿虚拟机来做例子,寄存器、栈、堆缓存就像工作内存,硬件设备就是主内存。

定义了八种操作来完成上述存取过程

lock和unlock 作用于主内存,标识为某线程独占或释放,成对存在

read和load 读取和加载,从主内存将数据读给工作内存,再加载到工作内存,成对存在

use和assign 使用和赋值 作用于工作内存,将变量给工作引擎,将接收到的值进行处理 成对存在

store和write 存储和写入 从工作内存将数据存回主内存,再写入主内存 成对存在

顺序过程unlock放到write后面即可。不允许读不入工作内存,也不允许写不入主内存;新变量只能在主内存中产生,不能跳级执行,lock与unlock一样重复执行多次,只是每次lock工作内存则被清空。lock可类比为Java的Lock对象。

 讲完上面的存取过程,变量的原子性就很好讲了,原子性指对变量的存取过程顺序执行,要么执行完,要么不执行,不允许其他线程对其进行污染。而带有特殊含义的sychronzied和final关键字,就可以用原子性来解释:前者由于保障了unlock之前变量已同步到主内存,这里的变量指方法体或类中所有的;后者是避免构造器把this引用传递出去,因而像惰性气体一样稳定。

另外java的先行发生原则,很有意思,有以下几种表现形式

1、程序控制流顺序执行,即代码顺序执行

2、volitale和锁顺序执行,即前一个锁执行结束,后一个得到锁

3、Thread的start方法先于run方法内的方法执行

4、通过isAlive、interrupt和join方法判断线程是否存活

5、对象结束先于finilize方法执行

6、A先于B,B先于C,可得出A先于C执行的传递性。

最后再讲下volatile关键字,它有两个作用 

1、保证改变后马上通知其他线程(执行write操作后,变量马上刷新),即对其他线程的可见性

2、保障上面所指丧心病狂的处理器处理此变量不被乱序操作,即禁止指令重排优化

但是volatile没有原子性,不能保证作为计数器而正确存在;所以一般如果很少对它标识的变量进行改变的场景比较适用,比如多条线程共同执行多个有父类的任务,一个条件通知结束,则所有线程一起结束;就像劳动节来临,不论工程师还是设计师,都可以休息一天。

补充一点,64位的long和double无原子性,会被当成两个32位变量来处理,但一般默认为具有原子性,占用两个局部变量的位置

虚拟机运行时的数据区域有以下几种

虚拟机栈 主要存放引用和基本数据类型

堆 主要存放对象

方法区 常见的类信息除对象以外的所有,包括类信息(数据类型),常量池,方法、接口、静态变量等

本地方法栈 用来执行native方法

程序计数器 存储下一条需要执行的字节码指令,每条线程都有一个

虚拟机的多线程是通过线程切换并分配执行时间,同时一个内核在任一时刻只处理一条线程的指令 

虚拟机栈和堆是线程共享的数据区,方法区、本地方法栈和程序计数器是线程所不能访问到的数据区

其中数据访问的方式有两种:一种是句柄形式,引用指向句柄,句柄包含对象地址和对象类型;一种是指针,直接存储对象地址,以句柄少一步,所以访问也会快一些,而HotSpot就是用这种;前者也有一定优化,值发生改变时,引用不用变,后者要改变指针才行。

内存异常有两种表现,一种叫OutOfMemoryError(内存溢出),请求的虚拟机扩展栈已无足够空间,分配给新对象,典型的标记-清理算法容易产品这种情况,另一种叫StackOverflowError(内存泄露),请求的栈深度超过虚拟机所允许 ,例如下标超过数据大小,一般线程不同步会引起这种状况的产生。




你可能感兴趣的:(Java高级之内存模型分析)