对象头、锁的四种状态、Java和处理器实现原子操作的方式(CAS、锁机制;总线锁定、缓存锁定)

1.对象头

对象头、锁的四种状态、Java和处理器实现原子操作的方式(CAS、锁机制;总线锁定、缓存锁定)_第1张图片

Java对象头里的Mark Word里默认存储对象的HashCode、分代年龄和锁标记位
32位JVM的Mark Word的默认存储结构如下图所示:

在运行期间,Mark Word里存储的数据会随着锁标志位的变化而变化。Mark Word可能变化为存储以下4种数据,如下图所示:
对象头、锁的四种状态、Java和处理器实现原子操作的方式(CAS、锁机制;总线锁定、缓存锁定)_第2张图片

在64位虚拟机下,Mark Word是64bit大小的,其存储结构如下图所示:

对象头、锁的四种状态、Java和处理器实现原子操作的方式(CAS、锁机制;总线锁定、缓存锁定)_第3张图片

2.锁的四种状态

Java SE 1.6为了减少获得锁和释放锁带来的性能消耗,引入了“偏向锁”和“轻量级锁”。

在Java SE 1.6中,锁共有4种状态,级别从高到低依次是:

  • 无锁状态、
  • 偏向锁状态
  • 轻量级锁状态
  • 重量级锁状态

这几个状态会随着竞争情况逐渐升级。

锁可以升级但是不能降级。目的是为了提高获得锁和释放锁的效率。

2.1偏向锁

偏向锁的思想是偏向于让第一个获取锁对象的线程,这个线程在之后获取该锁就不再需要进行同步操作,甚至连 CAS 操作也不再需要。
 

当一个线程访问同步块并获取锁时,会在对象头和栈帧中的锁记录里存储锁偏向的线程ID

对象头、锁的四种状态、Java和处理器实现原子操作的方式(CAS、锁机制;总线锁定、缓存锁定)_第4张图片

以后该线程在进入和退出同步块时不需要再进行CAS操作来加锁和解锁,只需简单地测试一个对象头中的Mark Word里是否存储这指向当前线程的偏向锁。

  • 如果测试成功,表示线程已经获得了锁;
  • 测试失败,则需要再测试一下Mark Word中偏向锁的标识是否设置为了1(表示当前是偏向锁);
    • 如果没有,则使用CAS竞争锁,
    • 若设置了,则尝试使用CAS将对象头中的偏向锁指向当前线程。

2.1.1 偏向锁的撤销

使用的是等到竞争出现才释放锁的机制。(Revoke Bias)

所以当其它线程尝试竞争偏向锁的时候,持有偏向锁的线程才会释放锁。

这个撤销,需等到全局安全点(在这个点上,没有正在执行的字节码)

它会首先暂停拥有偏向锁的线程(线程1),然后检查持有偏向锁的线程是否活着。

  • 如果线程不处于活动状态,则将对象头设置成无锁状态;
  • 若线程仍然活着,拥有偏向锁的栈会被执行,遍历偏向锁对象的记录,栈中的锁记录和对象头的Mark Word要么重新偏向于其它线程,要么恢复到无锁或者标记对象不合适作为偏向锁。

最后唤醒暂停的线程。

对象头、锁的四种状态、Java和处理器实现原子操作的方式(CAS、锁机制;总线锁定、缓存锁定)_第5张图片

线程1演示了偏向锁初始化的流程,线程2演示了偏向锁撤销的流程。

2.1.2关闭偏向锁

偏向锁在Java 6和Java 7里是默认启用的,但是它在应用程序启动几秒钟之后才激活,如有必要可以使用JVM参数来关闭延迟 :-XX:BiasedLockingStartupDelay=0

如果你确定应用程序里所有的锁通常情况下处于竞争状态,可以通过JVM参数关闭偏向锁:-XX:-UseBiasedLocking=false,那么程序默认会进入轻量级锁状态

2.2轻量级锁

2.2.1轻量级锁加锁

线程在执行同步块之前,JVM会先在当前线程的栈桢中创建用于存储锁记录的空间,并将对象头中的Mark Word复制到锁记录中,官方称为Displaced Mark Word。然后线程尝试使用CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功,当前线程获得锁,如果失
败,表示其他线程竞争锁,当前线程便尝试使用自旋来获取锁。

2.2.2轻量级锁解锁

轻量级解锁时,会使用原子的CAS操作将Displaced Mark Word替换回到对象头,如果成功,则表示没有竞争发生。如果失败,表示当前锁存在竞争,锁就会膨胀成重量级锁下图是两个线程同时争夺锁,导致锁膨胀的流程图。
对象头、锁的四种状态、Java和处理器实现原子操作的方式(CAS、锁机制;总线锁定、缓存锁定)_第6张图片

因为自旋会消耗CPU,为了避免无用的自旋(比如获得锁的线程被阻塞住了),一旦锁升级成重量级锁,就不会再恢复到轻量级锁状态

2.3重量级锁

当锁处于这个状态下,其他线程试图获取锁时都会被阻塞住,当持有锁的线程释放锁之后会唤醒这些线程,被唤醒的线程就会进行新一轮
的夺锁之争。

2.4对比

对象头、锁的四种状态、Java和处理器实现原子操作的方式(CAS、锁机制;总线锁定、缓存锁定)_第7张图片

3.Java中实现原子操作

在Java中可以通过锁和循环CAS的方式来实现原子操作。

3.1 CAS操作

Compare and swap。JVM中的CAS操作正是利用了处理器提供的CMPXCHG指令实现的。

自旋CAS实现的基本思路就是循环进行CAS操作直到成功为止。

public class Counter{
    private AtomicInteger atomicI = new AtomicInteger(0);
    private int i = 0;

    public static void main(String[] args) {
        final Counter cas = new Counter();
        List ts = new ArrayList(600);
        long start = System.currentTimeMillis();
        for (int j = 0; j < 100; j++) {
            Thread t = new Thread(new Runnable() {
                @Override
                public void run() {
                    for (int i = 0; i < 10000; i++) {
                        cas.count();
                        cas.safeCount();
                    }
                }
            });
            ts.add(t);
        }
        for (Thread t : ts) {
            t.start();
        }
        // 等待所有线程执行完成
        for (Thread t : ts) {
            try {
                t.join();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
        System.out.println(cas.i);
        System.out.println(cas.atomicI.get());
        System.out.println(System.currentTimeMillis() - start);
    }
    /** * 使用CAS实现线程安全计数器 */
    private void safeCount() {
        for (;;) {
            int i = atomicI.get();
            boolean suc = atomicI.compareAndSet(i, ++i);
            if (suc) {
                break;
            }
        }
    }
    /*** 非线程安全计数器*/
    private void count() {
        i++;
    }    
}

 

当前的处理器基本都支持CAS,只不过每个厂家所实现的算法并不一样罢了。

每一个CAS操作过程都包含三个运算符:一个内存地址V,一个期望的值A和一个新值B。

操作的时候如果这个地址上存放的值等于这个期望的值A,则将地址上的值赋为新值B,否则不做任何操作。

CAS的基本思路就是,如果这个地址上的值和期望的值相等,则给其赋予新值,否则不做任何事儿,但是要返回原值是多少。

处理过程是一个原子操作。

3.1.1 CAS如何实现线程安全

其实在语言层面是没有做任何同步的操作的,源码上也没有任何锁加在上面,可它为什么是线程安全的呢?这就是Atomic包下这些类的奥秘:语言层面不做处理,我们将其交给硬件—CPU和内存,利用CPU的多处理能力,实现硬件层面的阻塞,再加上volatile变量的特性即可实现基于原子操作的线程安全。

所以说,CAS并不是无阻塞,只是阻塞并非在语言、线程方面,而是在硬件层面,所以无疑这样的操作会更快更高效!

虽然基于CAS的线程安全机制很好很高效,但要说的是,并非所有线程安全都可以用这样的方法来实现,这只适合一些粒度比较小,形如计数器这样的需求用起来才有效,否则也不会有锁的存在了。

3.1.2 CAS带来的三大问题:

1、 ABA问题

因为CAS需要在操作值的时候检查下值有没有发生变化,如果没有发生变化则更新。

但是如果一个值原来是A,变成了B,又变成了A,那么使用CAS进行检查时会发现它的值没有发生变化,但是实际上却变化了。

JUC包解决ABA问题的解决思路就是使用版本号。

提供了一个带有标记的原子引用类”AtomicStampedReference”,在变量前面追加上版本号,每次变量更新的时候把版本号加一,那么A-B-A 就会变成1A-2B-3A。

AtomicStampedReference类中的compareAndSet方法的作用是首先检查当前引用和预期引用是否相等,并且检查当前值和预期值是否相等,如果都相等,则以原子形式将该引用和该标志的值设置为给定的更新值。

2 、循环时间长开销大

自旋CAS如果长时间不成功,会给CPU带来非常大的执行开销。

如果JVM能支持处理器提供的pause指令那么效率会有一定的提升,pause指令有两个作用:

1、它可以延迟流水线执行指令(de-pipeline),使CPU不会消耗过多的执行资源,延迟的时间取决于具体实现的版本,在一些处理器上延迟时间是零;

2、它可以避免在退出循环的时候因内存顺序冲突(memory order violation)而引起CPU流水线被清空(CPU pipeline flush),从而提高CPU的执行效率。

3 、只能保证一个共享变量的原子操作

当对一个共享变量执行操作时,我们可以使用循环CAS的方式来保证原子操作,但是对多个共享变量操作时,循环CAS就无法保证操作的原子性,这个时候就可以用锁

3.2锁机制实现原子操作

锁机制保证了只有获得锁的线程才能够操作锁定的内存区域。

JVM内部实现了很多种锁机制,有偏向锁、轻量级锁和互斥锁。

  • 除了偏向锁,JVM实现锁的方式都用了循环CAS
  • 即当一个线程想进入同步块的时候使用循环CAS的方式来获取锁,当它退出同步块的时候使用循环CAS释放锁。

3.3JUC包

Java.unit.concurrent.atomic

Java从JDK1.5开始提供Java.unit.concurrent.atomic(简称Atomic包)。

这个包中的原子操作类提供了一种用法简单、性能高效、线程安全地更新一个变量的方式。

在Atomic包中一共提供了13个类,属于4种类型的原子更新方式:

  • 原子更新基本类型
  • 原子更新数组
  • 原子更新引用
  • 原子更新属性(字段)。

比如在AtomicInteger类中value值是volatile属性的,并且在对value进行加或减的操作是需要进行CAS比较。

比如AtomicInteger对象的addAndGet(int delta):以原子方式将输入的数值与实例中的值相加,并返回结果。

static AtomicInteger ai = new AtomicInteger(1);

public static void main(String[] args) {
    System.out.println(ai.addAndGet(3));
    System.out.println(ai.get());
}

/**
     * Atomically adds the given value to the current value.
     *
     * @param delta the value to add
     * @return the updated value
     */
public final int addAndGet(int delta) {
    for (;;) {
        int current = get();//Step1
        int next = current + delta;//Step2
        if (compareAndSet(current, next))//Step3
            return next;
        }
}

public final boolean compareAndSet(int expect, int update) {
    return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
}

Step1:先取得AtomicInteger里存储的数值;

Step2:对AtomicInteger中的当前数值进行加法运算;

Step3:调用compareAndSet方法来进行原子更新操作,该方法先检查当前数值是否等于current,等于意味着AtomicInteger的当前数值更新成next的值,如果不等compareAndSet方法会返回false,程序会进入for循环重新进行compareAndSet操作。

4.处理器实现原子操作

32位IA-32处理器使用基于对缓存加锁或总线加锁的方式来实现多处理器之间的原子操作。

首先处理器会自动保证基本的内存操作的原子性。处理器保证从系统内存中读取或者写入一个字节是原子的,意思是当一个处理器读取一个字节时,其他处理器不能访问这个字节的内存地址。

处理器提供总线锁定和缓存锁定两个机制来保证复杂内存操作的原子性。

4.1总线锁定

如果多个处理器同时对共享变量进行读改写操作(i++就是经典的读改写操作),那么共享变量就会被多个处理器同时进行操作,这样读改写操作就不是原子的,操作完之后共享变量的值会和期望的不一致。

处理器使用总线锁就是来解决这个问题的。所谓总线锁就是使用处理器提供的一个LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存

缺陷:开销大。在同一时刻,我们只需保证对某个内存地址的操作是原子性即可,但总线锁定把CPU和内存之间的通信锁住了,这使得锁定期间,其他处理器不能操作其他内存地址的数据,所以总线锁定的开销比较大。

4.2缓存锁定

频繁使用的内存会缓存在处理器的L1、L2和L3高速缓存里,那么原子操作就可以直接在 处理器内部缓存中进行,并不需要声明总线锁。

“缓存锁定”是指内存区域如果被缓存在处理器的缓存行中,并且在Lock操作期间被锁定,那么当它执行锁操作回写到内存时,处理器不在总线上声言LOCK#信号,而是修改内部的内存地址,并允许它的缓存一致性机制来保证操作的原子性。

  • 因为缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据。
  • 当其他处理器回写已被锁定的缓存行的数据时,会使缓存行无效。

4.2.1 处理器不会使用缓存锁定的情况

1、当操作的数据不能被缓存在处理器内部,或操作的数据跨多个缓存行(cache line)时,则处理器会调用总线锁定;

2、有些处理器不支持缓存锁定。对于Intel 486和Pentium处理器,就算锁定的内存区域在处理器的缓存行中也会调用总线锁定。

针对以上两个机制,通过Intel处理器提供了很多Lock前缀的指令来实现。

  • 位测试和修改指令:BTS、BTR、BTC;交换指令XADD、CMPXCHG,以及其他一些操作数和逻辑指令(如ADD、OR)等,被这些指令操作的内存区域就会加锁,导致其他处理器不能同时访问它。


 

你可能感兴趣的:(并发编程)