java线程安全

 最近想将java基础的一些东西都整理整理,写下来,这是对知识的总结,也是一种乐趣。已经拟好了提纲,大概分为这几个主题: java线程安全,java垃圾收集,java并发包详细介绍,java profile和jvm性能调优 。慢慢写吧。本人jameswxx原创文章,转载请注明出处,我费了很多心血,多谢了。关于java线程安全,网上有很多资料,我只想从自己的角度总结对这方面的考虑,有时候写东西是很痛苦的,知道一些东西,但想用文字说清楚,却不是那么容易。我认为要认识java线程安全,必须了解两个主要的点:java的内存模型,java的线程同步机制。特别是内存模型,java的线程同步机制很大程度上都是基于内存模型而设定的。后面我还会写java并发包的文章,详细总结如何利用java并发包编写高效安全的多线程并发程序。暂时写得比较仓促,后面会慢慢补充完善。

浅谈java内存模型
不同的平台,内存模型是不一样的,但是jvm的内存模型规范是统一的。其实java的多线程并发问题最终都会反映在java的内存模型上,所谓线程安全无非是要控制多个线程对某个资源的有序访问或修改。总结java的内存模型,要解决两个主要的问题:可见性和有序性。我们都知道计算机有高速缓存的存在,处理器并不是每次处理数据都是取内存的。JVM定义了自己的内存模型,屏蔽了底层平台内存管理细节,对于java开发人员,要清楚在jvm内存模型的基础上,如果解决多线程的可见性和有序性。
那么,何谓可见性? 多个线程之间是不能互相传递数据通信的,它们之间的沟通只能通过共享变量来进行。Java内存模型(JMM)规定了jvm有主内存,主内存是多个线程共享的。当new一个对象的时候,也是被分配在主内存中,每个线程都有自己的工作内存,工作内存存储了主存的某些对象的副本,当然线程的工作内存大小是有限制的。当线程操作某个对象时,执行顺序如下:
(1) 从主存复制变量到当前工作内存 (read and load)
(2) 执行代码,改变共享变量值 (use and assign)
(3) 用工作内存数据刷新主存相关内容 (store and write)

JVM规范定义了线程对主存的操作指令:read,load,use,assign,store,write。当一个共享变量在多个线程的工作内存中都有副本时,如果一个线程修改了这个共享变量,那么其他线程应该能够看到这个被修改后的值,这就是多线程的可见性问题。
那么,什么是有序性呢 ?线程在引用变量时不能直接从主内存中引用,如果线程工作内存中没有该变量,则会从主内存中拷贝一个副本到工作内存中,这个过程为read-load,完成后线程会引用该副本。当同一线程再度引用该字段时,有可能重新从主存中获取变量副本(read-load-use),也有可能直接引用原来的副本 (use),也就是说 read,load,use顺序可以由JVM实现系统决定。
线程不能直接为主存中中字段赋值,它会将值指定给工作内存中的变量副本(assign),完成后这个变量副本会同步到主存储区(store- write),至于何时同步过去,根据JVM实现系统决定.有该字段,则会从主内存中将该字段赋值到工作内存中,这个过程为read-load,完成后线程会引用该变量副本,当同一线程多次重复对字段赋值时,比如:

Java代码

  1. for(int i=0;i<10;i++)
  2. a++;

for(int i=0;i<10;i++)

a++;


线程有可能只对工作内存中的副本进行赋值,只到最后一次赋值后才同步到主存储区,所以assign,store,weite顺序可以由JVM实现系统决定。假设有一个共享变量x,线程a执行x=x+1。从上面的描述中可以知道x=x+1并不是一个原子操作,它的执行过程如下:
1 从主存中读取变量x副本到工作内存
2 给x加1
3 将x加1后的值写回主 存
如果另外一个线程b执行x=x-1,执行过程如下:
1 从主存中读取变量x副本到工作内存
2 给x减1
3 将x减1后的值写回主存
那么显然,最终的x的值是不可靠的。假设x现在为10,线程a加1,线程b减1,从表面上看,似乎最终x还是为10,但是多线程情况下会有这种情况发生:
1:线程a从主存读取x副本到工作内存,工作内存中x值为10
2:线程b从主存读取x副本到工作内存,工作内存中x值为10
3:线程a将工作内存中x加1,工作内存中x值为11
4:线程a将x提交主存中,主存中x为11
5:线程b将工作内存中x值减1,工作内存中x值为9
6:线程b将x提交到中主存中,主存中x为9
同样,x有可能为11,如果x是一个银行账户,线程a存款,线程b扣款,显然这样是有严重问题的,要解决这个问题,必须保证线程a和线程b是有序执行的,并且每个线程执行的加1或减1是一个原子操作。看看下面代码:

Java代码

  1. public class Account {
  2. private int balance;
  3. public Account(int balance) {
  4. this.balance = balance;
  5. }
  6. public int getBalance() {
  7. return balance;
  8. }
  9. public void add(int num) {
  10. balance = balance + num;
  11. }
  12. public void withdraw(int num) {
  13. balance = balance - num;
  14. }
  15. public static void main(String[] args) throws InterruptedException {
  16. Account account = new Account(1000);
  17. Thread a = new Thread(new AddThread(account, 20), "add");
  18. Thread b = new Thread(new WithdrawThread(account, 20), "withdraw");
  19. a.start();
  20. b.start();
  21. a.join();
  22. b.join();
  23. System.out.println(account.getBalance());
  24. }
  25. static class AddThread implements Runnable {
  26. Account account;
  27. int amount;
  28. public AddThread(Account account, int amount) {
  29. this.account = account;
  30. this.amount = amount;
  31. }
  32. public void run() {
  33. for (int i = 0; i < 200000; i++) {
  34. account.add(amount);
  35. }
  36. }
  37. }
  38. static class WithdrawThread implements Runnable {
  39. Account account;
  40. int amount;
  41. public WithdrawThread(Account account, int amount) {
  42. this.account = account;
  43. this.amount = amount;
  44. }
  45. public void run() {
  46. for (int i = 0; i < 100000; i++) {
  47. account.withdraw(amount);
  48. }
  49. }
  50. }
  51. }

public class Account {

private int balance;

public Account(int balance) {

this.balance = balance;

}

public int getBalance() {

return balance;

}

public void add(int num) {

balance = balance + num;

}

public void withdraw(int num) {

balance = balance - num;

}

public static void main(String[] args) throws InterruptedException {

Account account = new Account(1000);

Thread a = new Thread(new AddThread(account, 20), "add");

Thread b = new Thread(new WithdrawThread(account, 20), "withdraw");

a.start();

b.start();

a.join();

b.join();

System.out.println(account.getBalance());

}

static class AddThread implements Runnable {

Account account;

int amount;

public AddThread(Account account, int amount) {

this.account = account;

this.amount = amount;

}

public void run() {

for (int i = 0; i < 200000; i++) {

account.add(amount);

}

}

}

static class WithdrawThread implements Runnable {

Account account;

int amount;

public WithdrawThread(Account account, int amount) {

this.account = account;

this.amount = amount;

}

public void run() {

for (int i = 0; i < 100000; i++) {

account.withdraw(amount);

}

}

}

}


第一次执行结果为10200,第二次执行结果为1060,每次执行的结果都是不确定的,因为线程的执行顺序是不可预见的。这是java同步产生的根源,synchronized关键字保证了多个线程对于同步块是互斥的,synchronized作为一种同步手段,解决java多线程的执行有序性和内存可见性,而volatile关键字之解决多线程的内存可见性问题。后面将会详细介绍。


synchronized关键字
上面说了,java用synchronized关键字做为多线程并发环境的执行有序性的保证手段之一。当一段代码会修改共享变量,这一段代码成为互斥区或临界区,为了保证共享变量的正确性,synchronized标示了临界区。典型的用法如下:

Java代码

  1. synchronized(锁){
  2. 临界区代码
  3. }

synchronized(锁){

临界区代码

}


为了保证银行账户的安全,可以操作账户的方法如下:

Java代码

  1. public synchronized void add(int num) {
  2. balance = balance + num;
  3. }
  4. public synchronized void withdraw(int num) {
  5. balance = balance - num;
  6. }

public synchronized void add(int num) {

balance = balance + num;

}

public synchronized void withdraw(int num) {

balance = balance - num;

}


刚才不是说了synchronized的用法是这样的吗:

Java代码

  1. synchronized(锁){
  2. 临界区代码
  3. }

synchronized(锁){

临界区代码

}


那么对于public synchronized void add(int num)这种情况,意味着什么呢?其实这种情况,锁就是这个方法所在的对象。同理,如果方法是public static synchronized void add(int num),那么锁就是这个方法所在的class。
理论上,每个对象都可以做为锁,但一个对象做为锁时,应该被多个线程共享,这样才显得有意义,在并发环境下,一个没有共享的对象作为锁是没有意义的。假如有这样的代码:

Java代码

  1. public class ThreadTest{
  2. public void test(){
  3. Object lock=new Object();
  4. synchronized (lock){
  5. //do something
  6. }
  7. }
  8. }

public class ThreadTest{

public void test(){

Object lock=new Object();

synchronized (lock){

//do something

}

}

}


lock变量作为一个锁存在根本没有意义,因为它根本不是共享对象,每个线程进来都会执行Object lock=new Object();每个线程都有自己的lock,根本不存在锁竞争。
每个锁对象都有两个队列,一个是就绪队列,一个是阻塞队列,就绪队列存储了将要获得锁的线程,阻塞队列存储了被阻塞的线程,当一个被线程被唤醒 (notify)后,才会进入到就绪队列,等待cpu的调度。当一开始线程a第一次执行account.add方法时,jvm会检查锁对象account 的就绪队列是否已经有线程在等待,如果有则表明account的锁已经被占用了,由于是第一次运行,account的就绪队列为空,所以线程a获得了锁,执行account.add方法。如果恰好在这个时候,线程b要执行account.withdraw方法,因为线程a已经获得了锁还没有释放,所以线程 b要进入account的就绪队列,等到得到锁后才可以执行。
一个线程执行临界区代码过程如下:
1 获得同步锁
2 清空工作内存
3 从主存拷贝变量副本到工作内存
4 对这些变量计算
5 将变量从工作内存写回到主存
6 释放锁
可见,synchronized既保证了多线程的并发有序性,又保证了多线程的内存可见性。


生产者/消费者模式
生产者/消费者模式其实是一种很经典的线程同步模型,很多时候,并不是光保证多个线程对某共享资源操作的互斥性就够了,往往多个线程之间都是有协作的。
假设有这样一种情况,有一个桌子,桌子上面有一个盘子,盘子里只能放一颗鸡蛋,A专门往盘子里放鸡蛋,如果盘子里有鸡蛋,则一直等到盘子里没鸡蛋,B专门从盘子里拿鸡蛋,如果盘子里没鸡蛋,则等待直到盘子里有鸡蛋。其实盘子就是一个互斥区,每次往盘子放鸡蛋应该都是互斥的,A的等待其实就是主动放弃锁,B 等待时还要提醒A放鸡蛋。
如何让线程主动释放锁
很简单,调用锁的wait()方法就好。wait方法是从Object来的,所以任意对象都有这个方法。看这个代码片段:

Java代码

  1. Object lock=new Object();//声明了一个对象作为锁
  2. synchronized (lock) {
  3. balance = balance - num;
  4. //这里放弃了同步锁,好不容易得到,又放弃了
  5. lock.wait();
  6. }

Object lock=new Object();//声明了一个对象作为锁

synchronized (lock) {

balance = balance - num;

//这里放弃了同步锁,好不容易得到,又放弃了

lock.wait();

}


如果一个线程获得了锁lock,进入了同步块,执行lock.wait(),那么这个线程会进入到lock的阻塞队列。如果调用 lock.notify()则会通知阻塞队列的某个线程进入就绪队列。
声明一个盘子,只能放一个鸡蛋

Java代码

  1. import java.util.ArrayList;
  2. import java.util.List;
  3. public class Plate {
  4. List<Object> eggs = new ArrayList<Object>();
  5. public synchronized Object getEgg() {
  6. while(eggs.size() == 0) {
  7. try {
  8. wait();
  9. } catch (InterruptedException e) {
  10. }
  11. }
  12. Object egg = eggs.get(0);
  13. eggs.clear();// 清空盘子
  14. notify();// 唤醒阻塞队列的某线程到就绪队列
  15. System.out.println("拿到鸡蛋");
  16. return egg;
  17. }
  18. public synchronized void putEgg(Object egg) {
  19. while(eggs.size() > 0) {
  20. try {
  21. wait();
  22. } catch (InterruptedException e) {
  23. }
  24. }
  25. eggs.add(egg);// 往盘子里放鸡蛋
  26. notify();// 唤醒阻塞队列的某线程到就绪队列
  27. System.out.println("放入鸡蛋");
  28. }
  29. static class AddThread extends Thread{
  30. private Plate plate;
  31. private Object egg=new Object();
  32. public AddThread(Plate plate){
  33. this.plate=plate;
  34. }
  35. public void run(){
  36. for(int i=0;i<5;i++){
  37. plate.putEgg(egg);
  38. }
  39. }
  40. }
  41. static class GetThread extends Thread{
  42. private Plate plate;
  43. public GetThread(Plate plate){
  44. this.plate=plate;
  45. }
  46. public void run(){
  47. for(int i=0;i<5;i++){
  48. plate.getEgg();
  49. }
  50. }
  51. }
  52. public static void main(String args[]){
  53. try {
  54. Plate plate=new Plate();
  55. Thread add=new Thread(new AddThread(plate));
  56. Thread get=new Thread(new GetThread(plate));
  57. add.start();
  58. get.start();
  59. add.join();
  60. get.join();
  61. } catch (InterruptedException e) {
  62. e.printStackTrace();
  63. }
  64. System.out.println("测试结束");
  65. }
  66. }

import java.util.ArrayList;

import java.util.List;

public class Plate {

List<Object> eggs = new ArrayList<Object>();

public synchronized Object getEgg() {

while(eggs.size() == 0) {

try {

wait();

} catch (InterruptedException e) {

}

}

Object egg = eggs.get(0);

eggs.clear();// 清空盘子

notify();// 唤醒阻塞队列的某线程到就绪队列

System.out.println("拿到鸡蛋");

return egg;

}

public synchronized void putEgg(Object egg) {

while(eggs.size() > 0) {

try {

wait();

} catch (InterruptedException e) {

}

}

eggs.add(egg);// 往盘子里放鸡蛋

notify();// 唤醒阻塞队列的某线程到就绪队列

System.out.println("放入鸡蛋");

}

static class AddThread extends Thread{

private Plate plate;

private Object egg=new Object();

public AddThread(Plate plate){

this.plate=plate;

}

public void run(){

for(int i=0;i<5;i++){

plate.putEgg(egg);

}

}

}

static class GetThread extends Thread{

private Plate plate;

public GetThread(Plate plate){

this.plate=plate;

}

public void run(){

for(int i=0;i<5;i++){

plate.getEgg();

}

}

}

public static void main(String args[]){

try {

Plate plate=new Plate();

Thread add=new Thread(new AddThread(plate));

Thread get=new Thread(new GetThread(plate));

add.start();

get.start();

add.join();

get.join();

} catch (InterruptedException e) {

e.printStackTrace();

}

System.out.println("测试结束");

}

}

执行结果:

Html代码

  1. 放入鸡蛋
  2. 拿到鸡蛋
  3. 放入鸡蛋
  4. 拿到鸡蛋
  5. 放入鸡蛋
  6. 拿到鸡蛋
  7. 放入鸡蛋
  8. 拿到鸡蛋
  9. 放入鸡蛋
  10. 拿到鸡蛋
  11. 测试结束

放入鸡蛋

拿到鸡蛋

放入鸡蛋

拿到鸡蛋

放入鸡蛋

拿到鸡蛋

放入鸡蛋

拿到鸡蛋

放入鸡蛋

拿到鸡蛋

测试结束


声明一个Plate对象为plate,被线程A和线程B共享,A专门放鸡蛋,B专门拿鸡蛋。假设
1 开始,A调用plate.putEgg方法,此时eggs.size()为0,因此顺利将鸡蛋放到盘子,还执行了notify()方法,唤醒锁的阻塞队列的线程,此时阻塞队列还没有线程。
2 又有一个A线程对象调用plate.putEgg方法,此时eggs.size()不为0,调用wait()方法,自己进入了锁对象的阻塞队列。
3 此时,来了一个B线程对象,调用plate.getEgg方法,eggs.size()不为0,顺利的拿到了一个鸡蛋,还执行了notify()方法,唤醒锁的阻塞队列的线程,此时阻塞队列有一个A线程对象,唤醒后,它进入到就绪队列,就绪队列也就它一个,因此马上得到锁,开始往盘子里放鸡蛋,此时盘子是空的,因此放鸡蛋成功。
4 假设接着来了线程A,就重复2;假设来料线程B,就重复3。
整个过程都保证了放鸡蛋,拿鸡蛋,放鸡蛋,拿鸡蛋。


volatile关键字
volatile是java提供的一种同步手段,只不过它是轻量级的同步,为什么这么说,因为volatile只能保证多线程的内存可见性,不能保证多线程的执行有序性。而最彻底的同步要保证有序性和可见性,例如synchronized。任何被volatile修饰的变量,都不拷贝副本到工作内存,任何修改都及时写在主存。因此对于Valatile修饰的变量的修改,所有线程马上就能看到,但是volatile不能保证对变量的修改是有序的。什么意思呢?假如有这样的代码:

Java代码

  1. public class VolatileTest{
  2. public volatile int a;
  3. public void add(int count){
  4. a=a+count;
  5. }
  6. }

public class VolatileTest{

public volatile int a;

public void add(int count){

a=a+count;

}

}


当一个VolatileTest对象被多个线程共享,a的值不一定是正确的,因为a=a+count包含了好几步操作,而此时多个线程的执行是无序的,因为没有任何机制来保证多个线程的执行有序性和原子性。volatile存在的意义是,任何线程对a的修改,都会马上被其他线程读取到,因为直接操作主存,没有线程对工作内存和主存的同步。所以,volatile的使用场景是有限的,在有限的一些情形下可以使用 volatile 变量替代锁。要使 volatile 变量提供理想的线程安全,必须同时满足下面两个条件:
1)对变量的写操作不依赖于当前值。
2)该变量没有包含在具有其他变量的不变式中
volatile只保证了可见性,所以Volatile适合直接赋值的场景,如

Java代码

  1. public class VolatileTest{
  2. public volatile int a;
  3. public void setA(int a){
  4. this.a=a;
  5. }
  6. }

public class VolatileTest{

public volatile int a;

public void setA(int a){

this.a=a;

}

}


在没有volatile声明时,多线程环境下,a的最终值不一定是正确的,因为this.a=a;涉及到给a赋值和将a同步回主存的步骤,这个顺序可能被打乱。如果用volatile声明了,读取主存副本到工作内存和同步a到主存的步骤,相当于是一个原子操作。所以简单来说,volatile适合这种场景:一个变量被多个线程共享,线程直接给这个变量赋值。这是一种很简单的同步场景,这时候使用volatile的开销将会非常小。

站内很多人都问我,所谓线程的“工作内存”到底是个什么东西?有的人认为是线程的栈,其实这种理解是不正确的。看看JLS(java语言规范)对线程工作内存的描述,线程的working memory只是cpu的寄存器和高速缓存的抽象描述。

可能 很多人都觉得莫名其妙,说JVM的内存模型,怎么会扯到cpu上去呢?在此,我认为很有必要阐述下,免得很多人看得不明不白的。先抛开java虚拟机不谈,我们都知道,现在的计算机,cpu在计算的时候,并不总是从内存读取数据,它的数据读取顺序优先级是:寄存器-高速缓存-内存。线程耗费的是CPU,线程计算的时候,原始的数据来自内存,在计算过程中,有些数据可能被频繁读取,这些数据被存储在寄存器和高速缓存中,当线程计算完后,这些缓存的数据在适当的时候应该写回内存。当个多个线程同时读写某个内存数据时,就会产生多线程并发问题,涉及到三个特性:原子性,有序性,可见性。在《线程安全总结》这篇文章中,为了理解方便,我把原子性和有序性统一叫做“多线程执行有序性”。支持多线程的平台都会面临这种问题,运行在多线程平台上支持多线程的语言应该提供解决该问题的方案。

那么,我们看看JVM,JVM是一个虚拟的计算机,它也会面临多线程并发问题,java程序运行在java虚拟机平台上,java程序员不可能直接去控制底层线程对寄存器高速缓存内存之间的同步,那么java从语法层面,应该给开发人员提供一种解决方案,这个方案就是诸如 synchronized, volatile,锁机制(如同步块,就绪队列,阻塞队列)等等。这些方案只是语法层面的,但我们要从本质上去理解它,不能仅仅知道一个 synchronized 可以保证同步就完了。 在这里我说的是jvm的内存模型,是动态的,面向多线程并发的,沿袭JSL的“working memory”的说法,只是不想牵扯到太多底层细节,因为《线程安全总结》这篇文章意在说明怎样从语法层面去理解java的线程同步,知道各个关键字的使用场景。

今天有人问我,那java的线程不是有栈吗?难道栈不是工作内存吗?工作内存这四个字得放到具体的场景中描述,方能体现它具体的意义,在描述JVM的线程同步时,工作内存指的是寄存器和告诉缓存的抽象描述,具体请自行参阅JLS。上面讲的都是动态的内存模型,甚至已经超越了JVM的范围,那么JVM的内存静态存储是怎么划分的?今天还有人问我,jvm的内存模型不是有eden区吗?也不见你提起。我跟他说,这是两个角度去看的,甚至是两个不同的范围,动态的线程同步的内存模型,涵盖了cpu,寄存器,高速缓存,内存;JVM的静态内存储模型只是一种对内存的物理划分而已,它只局限在内存,而且只局限在JVM的内存。那些什么线程栈,eden区都仅仅在JVM内存。

说说JVM的线程栈和有个朋友反复跟我纠结的eden区吧。JVM的内存,被划分了很多的区域:

1.程序计数器
每一个Java线程都有一个程序计数器来用于保存程序执行到当前方法的哪一个指令。
2.线程栈
线程的每个方法被执行的时候,都会同时创建一个帧(Frame)用于存储本地变量表、操作栈、动态链接、方法出入口等信息。每一个方法的调用至完成,就意味着一个帧在VM栈中的入栈至出栈的过程。如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;如果VM栈可以动态扩展(VM Spec中允许固定长度的VM栈),当扩展时无法申请到足够内存则抛出OutOfMemoryError异常。
3.本地方法栈
4.堆

每个线程的栈都是该线程私有的,堆则是所有线程共享的。当我们new一个对象时,该对象就被分配到了堆中。但是堆,并不是一个简单的概念,堆区又划分了很多区域,为什么堆划分成这么多区域,这是为了JVM的内存垃圾收集,似乎越扯越远了,扯到垃圾收集了,现在的jvm的gc都是按代收集,堆区大致被分为三大块:新生代,旧生代,持久代(虚拟的);新生代又分为eden区,s0区,s1区。新建一个对象时,基本小的对象,生命周期短的对象都会放在新生代的eden区中,eden区满时,有一个小范围的gc(minor gc),整个新生代满时,会有一个大范围的gc(major gc),将新生代里的部分对象转到旧生代里。
5.方法区
其实就是永久代(Permanent Generation),方法区中存放了每个Class的结构信息,包括常量池、字段描述、方法描述等等。VM Space描述中对这个区域的限制非常宽松,除了和Java堆一样不需要连续的内存,也可以选择固定大小或者可扩展外,甚至可以选择不实现垃圾收集。相对来说,垃圾收集行为在这个区域是相对比较少发生的,但并不是某些描述那样永久代不会发生GC(至 少对当前主流的商业JVM实现来说是如此),这里的GC主要是对常量池的回收和对类的卸载,虽然回收的“成绩”一般也比较差强人意,尤其是类卸载,条件相当苛刻。
6.常量池
Class文件中除了有类的版本、字段、方法、接口等描述等信息外,还有一项信息是常量表(constant_pool table),用于存放编译期已可知的常量,这部分内容将在类加载后进入方法区(永久代)存放。但是Java语言并不要求常量一定只有编译期预置入Class的常量表的内容才能进入方法区常量池,运行期间也可将新内容放入常量池(最典型的String.intern()方法)。

关于垃圾收集,在此不多说,流到垃圾收集那一章再详细说吧。关于java的同步,其实还有基于CPU原语的比较并交换的非阻塞算法(CAS),不过这个在java的并发包里已经实现了很多,因此关于这点,就留到java并发包那一章介绍吧。后面我会专门写一篇文章,JVM内存与垃圾收集。

 

如果你的代码所在的进程中有多个线程在同时运行,而这些线程可能会同时运行这段代码。如果每次运行结果和单线程运行的结果是一样的,而且其他的变量的值也和预期的是一样的,就是线程安全的。
比如一个 ArrayList 类,在添加一个元素的时候,它可能会有两步来完成:1. 在 Items[Size] 的位置存放此元素;2. 增大 Size 的值。

  在单线程运行的情况下,如果 Size = 0,添加一个元素后,此元素在位置 0,而且 Size=1;

  而如果是在多线程情况下,比如有两个线程,线程 A 先将元素存放在位置 0。但是此时 CPU 调度线程A暂停,线程 B 得到运行的机会。线程B也向此 ArrayList 添加元素,因为此时 Size 仍然等于 0 (注意哦,我们假设的是添加一个元素是要两个步骤哦,而线程A仅仅完成了步骤1),所以线程B也将元素存放在位置0。然后线程A和线程B都继续运行,都增加 Size 的值。

  那好,现在我们来看看 ArrayList 的情况,元素实际上只有一个,存放在位置 0,而 Size 却等于 2。这就是“线程不安全”了。
如何做到线程安全:
四种方式 sychronized关键字

1. sychronized method(){}

2. sychronized (objectReference) {/*block*/}

3. static synchronized method(){}

4. sychronized(classname.class)

其中1和2是代表锁当前对象,即一个对象就一个锁,3和4代表锁这个类,即这个类的锁。要注意的是sychronized method()不是锁这个函数,而是锁对象,即:如果这个类中有两个方法都是sychronized,那么只要有两个线程共享一个该类的reference,每个调用这两个方法之一,不管是否同一个方法,都会用这个对象锁进行同步。
注意:long 和double是简单类型中两个特殊的咚咚:java读他们要读两次,所以需要同步。

线程安全性:

一个类是线程安全的是指在被多个线程访问时,类可以持续进行正确的行为.不用考虑这些线程运行时环境下的调度和交替.

编写正确的并发程序的关键在于对共享的,可变的状态进行访问管理.
解决方案有两种:
1.控制资源访问.通过锁机制来对资源的访问进行排队.这样来避免一个线程修改其他线程正在使用的对象
2.要确保当一个线程修改了对象的状态后,其他的线程能够真正知道这种变化.

资源访问控制
-------------------------------
1. 无状态的类肯定是线程安全的,因为它不会存在交替的情况.因为所有要用到的资源都是通过参数传进去的.这样就不会存在多个线程共享资源的问题.

2.如果是 有状态的类,比如它有个属性是long count;它有个方法,是让它自增:count++; http://blog.sina.com.cn/s/blog_5f54f0be0100vwh8.html此文中已经介绍了该操作并发的风险.在代码中该操作看起来是一个单独的操作,但它实际上是由三个操作组成的.所以它不是 单独的,不可分割的.即:" 原子性".原子性不能指程序上的最基本的数字逻辑操作,而是逻辑上的不可分割的操作.

JAVA提供了一些线程安全的类,也就是实现了原子性的类.对这些类的操作是原子性的.它们是在:java.util.concurrent.atomic包中.比如有类:AtomicLong,它是Long的原子化类.我们对long类型的count进行自增操作时,不是原子性的,但对AtomicLong调用:incrementAndGet()即是原子操作的,JAVA为我们解决了这些问题.

同时,JAVA提供了我们自己可控制的原子机制-- .
JAVA提供了强制原子性的内置锁机制:synchronized .
我们通过synchronized给一个类,或一个方法或一个属性或一串操作进行锁标识.线程进入synchronized之前会自动获得锁;在正常退出,或出现异常时,线程都会释放锁.被锁上后,其它线程只有等到锁被释放才能进入.否则只有一直等下去.所以这种做法在有些时候会极端影响效率.(静态属性或方法的锁是从Class对象上获取的)

当一个线程请求其他线程已经占有的锁时,请求被阻塞.但占有锁的那个线程是可以再次请求的.这就意味着:锁的基于线程的而不是基于请求.实现这种机制是为每个锁关联一个请求计数和一个占有它的线程.当计数为0时,表示该锁未被占有.此时线程请求时,JVM将记录锁的占有线程,并将请求计数加1.如果同一线程再次请求这个锁,计数再加1.每次退出synchronized标识的块时计数会减1.当计数为0时,锁被释放.

并不是所有的数据都需要锁保护--只有那些被多个线程访问的可变数据才需要.过多的synchronized 会影响性能.所以我们最好是将一些需要同步的原子操作放在同步块中.如下面这种做法:

synchronized (this) {

++hits;

if (i.equals(lastNumber)) {

++cacheHits;

factors = lastFactors.clone();

}

}

if (factors == null) {

factors = factor(i);

synchronized (this) {

lastNumber = i;

lastFactors = factors.clone();

}

}

如上所示.两个分离的synchronized 块中都只有很简短的代码.第一个块保护着检查再运行的操作以检查对我们很重要的状态码,另一个进行数据的更新.

共享对象
-------------------------------
同步的可见性:
使用了synchronized进行加锁后,一个线程在该同步块内做的操作对接下来的线程是可见的.这就是"同步"的含义.
1.当一个读线程和一个写线程同时进行时,我们不能保证读线程能及时地读取写线程写入的值.除非使用 synchronized进行同步.例如下面代码所示:

private static boolean ready;

private static int number;

private static class ReaderThread extends Thread {

public void run() {

while (!ready)

Thread.yield();

System.out.println(number);

}

}

public static void main(String[] args) {

new ReaderThread().start();

number = 42;

ready = true;

}

上面的mian主线程运行时还充当了"写线程",并且新建"读线程"并让它运行.读线程会不断的循环直到ready的值为true.但在有些情况下,上面的程序会和我们想象的输入42相异:

由于JAVA的"重排序"机制(JVM:只要代码顺序改变对结果不产生影响,那么就不能保证代码执行的顺序是书写的顺序)可能在对number设置值前ready的值就已经是true了.那么输入的结果会是0.

2.在没有同步时,我们可能就象上面一样,获得到的数据不是最新设置进去的.如:一个类有一属性,并且有它的getter,setter方法,当两个线程一个执行getter一个执行setter时,就容易出现获得到" 过期数据".但给getter,setter方法加上synchronized 后可以解决这一问题.

除了过期数据,还可能出现错数据,这种问题只是存在于64位的数据.由于JVM的运算是基于32位的.即:不管是布尔值(1位),short(16位),运算时,都通过左侧补零将它扩展成32位,然后进行运算.而float,double,long 等64位的数据则被做为两个32位数进行运算.
所以,在多线程未同步时,64位数据的读取可能会返回一个值的前32位,及另一个值的后32位.通过给值加上 volatile标记可以让JVM避免这种问题.如:volatile float test;

当一个域声明为volatile 类型后,编译器与运行时会监视这个变量,而且对它的操作不会与其他的内在操作重排序.它不会缓存在寄存器或者缓存在其它地方,所以读一个volatile 类型的变量时,它总是返回由某一线程所写入的最新值.我们可以将它看做轻量级的同步机制.

private int value;

public synchronized int get() {

return value;

}

public synchronized void set(int value) {

this.value = value;

}

如上代码可以被:volatile private int value;以及不加同步声明的getter,setter方法所代替.但当然会牺少许功能:加锁可以保证可见性和原子性,但volatile变量只能保证可见性.所以,在不需要原子性的时候,可以用它.


 

你可能感兴趣的:(java线程安全)