Java并发编程第10讲——CAS相关知识点详解

前面介绍锁的时候顺便也提到了CAS,但作为JUC的“基石”和面试中的高频考点,还是不够。所以,本篇文章将从CAS的概念入手,逐步深入介绍12个Atomic原子操作类、CAS的实现原理(源码解析)、Unsafe类、CAS存在的问题以及LongAddr

一、什么是CAS

CAS全称Compare And Swap,顾名思义就是先比较再交换。主要应用就是实现乐观锁和锁自旋。CAS操作包含三个操作数——内存位置(V)、预期值(A)和新值(B)。在并发修改的时候,会先比较A和V的值是否相等,如果相等,则会把值替换成B,否则就不做任何操作。

当多个线程尝试使用CAS同时更新同一个变量时,只有其中一个线程能更新变量的值,而其它线程都失败,失败的线程不会被挂起,而是被告知这次竞争失败,并可以再次尝试。

在JDK1.5中新增的java.util.concurrent(JUC)就是建立在CAS之上的。相对于synchronized这种阻塞型的同步,CAS是非阻塞算法的一种常见实现,所以JUC在性能上有了很大的提升。

二、举个例子

我们先看一个经典的例子:

public class Demo {
    public static volatile int i=0;
    public static void increase(){
        i++;
    }
    public static void main(String[] args) throws InterruptedException {
        //启动10个线程,每个线程累加10000次
        for (int j = 0; j < 10; j++) {
            new Thread(() -> {
                for (int k = 0; k < 10000; k++) {
                    increase();
                }
            }, String.valueOf(j)).start();
        }
        while (Thread.activeCount() > 2) {
            Thread.yield();
        }
        System.out.println("最后i的值为:" + i);
    }
}

这个例子在Java并发编程第5讲——volatile关键字中也用过,启动10个线程,每个线程累加10000次,那么i的预期的结果是100000,但运行完这段代码得到的结果都是小于100000的数字。

这是因为volatile只能保证可见性,无法保证原子性,而自增操作并不是一个原子操作,它会出现写回主存覆盖的问题,送一我们每次都无法获得想要的结果,那么如何解决呢?说白了,这也就是线程安全问题,那么我们可以从保障线程安全入手,以下提供几个方案:

  • synchronized:线程内使用同步代码块,由JVM自身的机制来保障线程的安全性。
  • Lock锁:基于AQS+CAS实现。
  • Atomic原子类:这就是我们今天的主角,下面再细说。
  • LongAdder原子类:和Atomic原子类在同一包下,不过LongAdder更适合于高并发场景下,特别是写大于读的场景,相较于Atomic性能更好,代价是消耗更多的空间,以空间换时间。(下面也会细说)。

三、12个Atomic原子操作类

Java从JDK 1.5开始提供了java.util.concurrent.atomic包,这个包中的原子操作类提供了一种用法简单、性能高效、线程安全地更新一个变量的方式。

因为变量的类型由很多种,所以在Atomic包里一共提供了12个类,可以分为4种类型,分别是基本类型、数组、引用、字段。Atomic包里的类基本都是使用Unsafe实现的包装类。

3.1 基本类型(3个)

  • AtomicBoolean:布尔类型
  • AtomicInteger:整型类型
  • AtomicLong:长整型类型

它们三个提供的方法基本一样,所以就以AtomicInteger为例,下面是它常用的方法:

  • AtomicInteger(int initialValue):构造方法,设置初始值,若不设置则初始值为0。
  • int getAndIncrement():以原子方式进行+1操作,并返回自增前的值。
  • int IncrementAndGet():以原子方式进行+1操作,并返回自增后的值。
  • int decrementAndGet():以原子方式进行-1操作,并返回自减后的值。
  • int get():返回当前值。
  • int addAndGet(int delta):以原子方式将输入的值于当前值相加,并返回结果。
  • boolean compareAndSet(int expect,int update):如果输入的值(expect)等于AtomicInteger的当前值,则以原子的方式将该值设置为输入的值(update),成功返回ture,反之返回false。

现在,我们可以用AtomicInteger来改造一下上面的代码,使其正常运行:

public class Demo {
    public static AtomicInteger i=new AtomicInteger();
    public static void increase(){
        i.getAndIncrement();
    }
    public static void main(String[] args) throws InterruptedException {
        //启动10个线程,每个线程累加1000次
        for (int j = 0; j < 10; j++) {
            new Thread(() -> {
                for (int k = 0; k < 10000; k++) {
                    increase();
                }
            }, String.valueOf(j)).start();
        }
        while (Thread.activeCount() > 2) {
            Thread.yield();
        }
        System.out.println("最后i的值为:" + i.get());//100000
    }
}

我们把i改成使用AtomicInteger定义,i++改为“i.incrementAndGet()”使其变成原子操作,所以我们可以确保每次都可以获得正确的结果,并且性能上也有了不错的提升。

3.2 数组类型(3个)

通过原子的方式更新数组里的某个元素。

  • AtomicIntegerArray:整型数组
  • AtomicLongArray:长整型数组
  • AtomicReferenceArray:引用类型数组

这三个提供的方法也基本一样,下面以AtomicIntegerArray为例,先看一下它的常用方法:

  • AtomicIntegerArray(int length):构造方法,创建指定长度的AtomicIntegerArray对象,所有元素的初始值都是0。
  • AtomicIntegerArray(int[] array):构造方法,使用指定的整型数组初始化AtomicIntegerArray对象,数组的长度就是AtomicIntegerArray的长度。
  • int get(int index):获取指定索引处的元素值。
  • int length:返回数组的长度。
  • void set(int index,int newValue):设置指定索引处的新值。
  • int getAndIncrement(int index):获取指定索引处的旧值,并将其+1。
  • int getAndDecrement(int index):获取指定索引处的旧值,并将其-1。
  • int getAndAdd(int index,int delta):获取指定索引处的旧值,并将其加delta。

举个例子:

public class ArrayDemo {
    public static void main(String[] args) {
        //指定长度为3的AtomicIntegerArray对象,初始值都是0
        AtomicIntegerArray array=new AtomicIntegerArray(3);
        //获取索引为0的元素值
        System.out.println(array.get(0));//0
        //给索引为1的元素值设置为5
        array.set(1,5);
        System.out.println(array.get(1));//5
    }
}

3.3 引用类型(3个)

如果要原子更新多个变量,就需要使用这个原子更新引用类型提供的类。

  • AtomicReference:原子更新引用类型。
  • AtomicStampedReference:在AtomicReference的基础上增加了版本号的功能。
  • AtomicMarkableReference:在AtomicReference的基础上增加了布尔标记的功能。

下面就以AtomicReference为例,常用方法:

  • AtomicReference(V initialValue):构造方法,创建一个AtomicReference对象,并将初始值设置为initialValue。
  • V get():获取当前的引用值。
  • void set(V newValue):设置新的引用值。
  • boolean compareAndSet(V expect,V update):如果引用值于期望值相等,则设置update为新值。
  • V getAndSet(V newValue):设置新的引用,并返回旧的引用。

举个例子:

public class ReferenceDemo {
​
    public static void main(String[] args) {
        Student student = new Student("张三", 20);
        //创建一个指定引用为Student的AtomicReference对象
        AtomicReference reference=new AtomicReference<>(student);
        //获取当前引用
        System.out.println(reference.get());//ReferenceDemo.Student(name=张三, age=20)
        //修改student引用
        student.setAge(18);
        student.setName("小黑子");
        //设置新的引用
        reference.set(student);
        System.out.println(reference.get());//ReferenceDemo.Student(name=小黑子, age=18)
    }
​
    @AllArgsConstructor
    @NoArgsConstructor
    @Data
    static class Student{
        private String name;
        private int age;
    }
}

3.4 字段类型(3个)

如果需要原子地更新某个类的某个字段时,那么就可以用原子更新字段类。

  • AtomicIntegerFieldUpdater:整型,可以在指定的对象上进行原子更新操作,支持原子地设置、获取、增加、减少等操作。
  • AtomicLongFieldUpdater:长整型,可以在指定的对象上进行原子更新操作,支持原子地设置、获取、增加、减少等操作。
  • AtomicReferenceFieldUpdater:引用类型,可以在指定的对象上进行原子更新操作,支持原子地设置、获取、增加、减少等操作。

下面以AtomicIntegerFieldUpdater为例,常用方法:

  • AtomicIntegerFieldUpdater newUpdater(Class tclass,String fieldName):用于操作指定类种的指定字段。
  • int get(T obj):获取指定对象的字段的当前值。
  • void set(T obj,int newValue):设置指定对象的字段的值为指定的新值。
  • int getAndIncrement(T obj):以原子的方式将指定对象的字段+1,并返回旧值。
  • int getAndDecrement(T obj):以原子的方式将指定对象的字段-1,并返回旧值。

举个例子:

@Data
public class IntegerUpdaterDemo {
    //字段必须是 volatile 类型的
    private volatile int score;
    //创建AtomicIntegerFieldUpdater 实例
    private static final AtomicIntegerFieldUpdater SCORE_UPDATER =
            AtomicIntegerFieldUpdater.newUpdater(IntegerUpdaterDemo.class, "score");
​
    public static void main(String[] args) {
        IntegerUpdaterDemo demo = new IntegerUpdaterDemo();
        demo.setScore(80);
        //使用AtomicIntegerFieldUpdater进行原子性更新操作
        int newValue = 90;
        int oldValue = SCORE_UPDATER.getAndSet(demo, newValue);
        System.out.println("原始值: " + oldValue + ", 更新后的值: " + demo.getScore());  //原始值: 80, 更新后的值: 90 
    }
}

四、CAS实现原理

下面以AtomicInteger原子整型类为例,分析一下CAS底层实现机制。

4.1 AtomicInteger的getAndIncrement方法

上面解决i++问题的时候用到了AtomicInteger的getAndIncrement方法,通过方法调用,可以发现getAndIncrement方法调用了getAndAddInt方法,最后调用的是Unsafe类的compareAndSwapInt方法,也就是我们今天要介绍的CAS:

Java并发编程第10讲——CAS相关知识点详解_第1张图片

compareAndSwapInt方法参数解释:

  • var1:Unsafe对象本身,需要通过这个类获取value的内存偏移地址。
  • var2:value变量的内存偏移地址。
  • var4:需要增加或减少的数。
  • var5:内存位置的最新值。
  • var5+var4:要更新的最新值。

就是拿到内存位置的最新值var5,使用CAS尝试将内存位置的值修改为目标值var5+var4,如果修改失败,则获取改内存位置的新值var5,然后继续尝试,直到成功。

4.2 Unsafe类

读到这我们知道Java中Atomic类的实现都是基于Unsafe类实现的,那么Unsafe类是什么呢?

4.2.1 什么是Unsafe类

Unsafe类是CAS的核心类。因为Java无法直接访问底层操作系统,而是通过本地(native)方法来访问。不过JVM还是开了一个后门,JDK中有一个Unsafe类,他提供了硬件级别的原子操作,说白了Unsafe类就是跟底层硬件CPU指令通讯的复制工具。

Unsafe类包含了很多基础操作,比如数组操作、对象操作、内存操作、CAS操作、线程(park)操作,栅栏(Fence)操作,JUC包以及一些三方框架都是用Unsafe类来保证线程安全。

Unsafe类在jdk源码的多个类中用到,这个类提供了一些绕开JVM的更底层的功能,基于它的实现可以提高效率。不过,正如它名字那样——不安全类,他所分配的内存需要手动free(不会被GC回收)。

Unsafe类提供了硬件级别的操作,主要有以下功能:

  • 通过Unsafe类可以分配内存,可以释放内存。
  • 可以定位对象某字段的内存位置,也可以修改对象的字段值,即使它是私有的。
  • 将线程进行挂起与恢复。
  • CAS操作。

4.2.2 举个例子

Unsafe被设计的初衷,并不是希望被一般开发者调用,它的构造方法是私有的,所以我们不能通过new或工厂方法实例化Unsafe对象,通常用反射来获取Unsafe示例:

private static Unsafe getUnsafeInstance() throws NoSuchFieldException, IllegalAccessException {
    //Unsafe类中提供了一个静态的getUnsafe方法,可以返回一个Unsafe实例
    Field unsafeField = Unsafe.class.getDeclaredField("theUnsafe");
    unsafeField.setAccessible(true);
    return (Unsafe) unsafeField.get(null);
}

来看一下分配内存的例子:

public class UnsafeDemo {
    public static void main(String[] args) throws NoSuchFieldException, IllegalAccessException {
        Unsafe unsafe = getUnsafeInstance();
        //分配一个包含10个整数的连续内存空间
        long size = 10 * Integer.BYTES;
        //分配内存
        long memoryAddress = unsafe.allocateMemory(size);
        //在内存中存储值
        for (int i = 0; i < 10; i++) {
            unsafe.putInt(memoryAddress + i * Integer.BYTES, i);
        }
        for (int i = 0; i < 10; i++) {
            //从内存中读取值
            int value = unsafe.getInt(memoryAddress + i * Integer.BYTES);
            System.out.println(value);
        }
        //释放内存
        unsafe.freeMemory(memoryAddress);
    }
    //获取Unsafe实例
    private static Unsafe getUnsafeInstance() throws NoSuchFieldException, IllegalAccessException {
        Field unsafeField = Unsafe.class.getDeclaredField("theUnsafe");
        unsafeField.setAccessible(true);
        return (Unsafe) unsafeField.get(null);
    }
}

同样,也可以用Unsafe类实现一个CAS操作,这里就不做演示了。

4.2.3 Unsafe类的compareAndSwapInt方法

介绍完Unsafe类,我们书接4.1,接着继续深入探讨该方法,该方法在Unsafe中对应的C++源码如下:

Java并发编程第10讲——CAS相关知识点详解_第2张图片

可以看到调用了Atomic::cmpxchg方法,那么我们再来看看Atomic::cmpxchg方法:

Java并发编程第10讲——CAS相关知识点详解_第3张图片

标红框的地方就是调用了汇编指令cmpxchg,作用是比较并交换而CAS操作的原理就是基于硬件提供的原子操作指令——cmpxchg指令实现的:

  • cmpxchg指令是一条原子指令。在cpu执行cmpxchg指令时,处理器会自动锁定总线,防止其它cpu刚问共享变量,然后执行比较和交换操作,最后释放总线。
  • cmpxchg指令在执行期间,cpu会自动禁止中断。这样可以确保CAS操作的原子性,避免中断或其它干扰对操作的影响。
  • cmpxchg指令时硬件实现的,可以保证其原子性和正确性。cpu中的硬件电路确保了cmpxchg指令的正确执行,以及对共享变量的访问原子性。

ps:同样是因为cmpxchg指令,这个指令基于cpu缓存一致性协议实现的。在多个cpu中,所有核心的缓存都是一致的。当一个cpu核心执行cmpxchg指令时,其它cpu核心的缓存会自动更新,以确保对共享变量的访问是一致的。

五、CAS存在的问题

任何技术都不是十全十美的,强如硬件级别实现的CAS操作也会有瑕疵。

5.1 ABA问题

CAS算法实现一个重要前提是需要取出内存中某时刻的数据,而在下个时刻进行比较和交换,那么这个时间差会导致数据的变化。

比如,当线程1要修改A时,会先读取A的值,如果此时有一个线程2,经过一系列操作,将A修改为B,再由B修改为A,然后线程1在比较A时,发现A的值没有改变,于是就修改了。但此时A的版本已经不是最先读取的版本了,这就时ABA问题。

如何解决?解决这个问题的办法也很简单,就是添加版本号,修改数据时带上一个版本号,如果版本号我数据的版本号一致就修改(同时修改版本号),否则就失败,或者改用传统的互斥同步方式。

5.2 忙等待问题

上面的getAndAddInt方法就是一个很好的例子,getAndAddInt方法执行时,如果CAS失败,会一直尝试。如果CAS长时间一直不成功,可能会给CPU带来很大的开销。

5.3 只能保证一个共享变量的原子操作

当对一个共享变量操作时,我们可以用CAS的方式来保证原子操作,但是对于多个共享变量操作时,循环CAS就无法保证操作的原子性,这个时候我们可能就会用锁来保证原子性。

六、LongAdder

在5.2中提到的忙等待问题会给CPU带来很大的开销,从而会使性能下降。当然在大部分场景下使用Atomic原子操作类还是绰绰有余的,但在多线程竞争比较激烈,也就是并发冲突比较大的情况下,就得考虑其它方案了,比如LongAddr。

6.1 什么是LongAddr

LongAddr是Java 8中推出的一个新的类,主要是为了解决Atomic原子操作类在多线程竞争激烈的情况下性能并不高的问题,它主要是采用分段+CAS的方式来提升原子操作的性能。

但是性能高就意味着要有牺牲,而LongAddr就是典型的以空间换时间的实现方式,所以它需要用到更大的空间,而且LongAddr还可能存在结果不准确的问题,Atomic原子操作类并不会。

将AtomicInteger的例子改造一下:

public class LongAddrDemo {
    public static LongAdder i=new LongAdder();
    public static void increase(){
        i.increment();
    }
    public static void main(String[] args) throws InterruptedException {
        //启动10个线程,每个线程累加1000次
        for (int j = 0; j < 10; j++) {
            new Thread(() -> {
                for (int k = 0; k < 10000; k++) {
                    increase();
                }
            }, String.valueOf(j)).start();
        }
        while (Thread.activeCount() > 2) {
            Thread.yield();
        }
        System.out.println(i.sum());//100000
    }
}

6.2 LongAddr实现原理(源码解析)

Java 8中的LongAddr类继承自抽象类Striped64(也是atomic包下的),这个类也是Java 8新增的,主要的作用就是给并发场景下提供计数支持。

Striped64的设计思路与ConcurrentHashMap类似,都是通过分散竞争的方式来提升并发性能,其中主要依赖了两个字段:

Java并发编程第10讲——CAS相关知识点详解_第4张图片

解释:

  • cells数组:当检测到有base变量被线程占有时,就会尝试暂存在cells数组中。
  • base变量:当没有线程竞争时,首先会改变base的值。

最终的结果:base变量+cells数组中value。

通过查看LongAddr中的add方法的代码,我们就能更好地理解:

Java并发编程第10讲——CAS相关知识点详解_第5张图片

解释:

  • 外层if:判断是否需要通过base进行累加

    • 如果cells数组!=null,说明已经存在分段累加器(cells数组),则不需要base进行累加。

    • 如果cells数组==null,即不存在分段累加器,那么就尝试使用cas进行base累加,失败则进入if进行更细粒度的累加。

  • 内层if:进一步判断是否需要进行细粒度的累加操作

    • 再一次判断cells数组是否为空,为空则表示没有分段的累加器。不为空进入下一步。

    • cells数组长度m是否小于0。不小于0进入下一步。

    • getProbe()&m通过探针索引获取cells数组中的某个位置的cell对象a,看是否有初始化。不为空进入下一步。

    • 将Cell对象a的value与v+x进行CAS操作。

满足以上四个判断之一,则调用longAccumulate方法进行细粒度的累加操作。

总结一下,首先尝试通过CAS更新base的值,如果再竞争不激烈的情况下,是可以CAS成功的,如果成功,那么就和Atomic原子操作类一样了。如果失败,那么就代表竞争激烈,那么就会尝试通过cells数组来分散计数。Striped64根据线程来计算哈希,然后将不同的线程分散到不同Cell数组的index上,然后这个线程的计数内容就会保存在该Cell的位置上面,最后总计数则是base加上cells数组中的计数内容。

这跟ConcurrentHashMap的分段锁很像吧。最后再来看看它是怎么统计的:

Java并发编程第10讲——CAS相关知识点详解_第6张图片

很简单,就是将base和cells数组中的值都加起来得到最终的结果。

6.3 LongAddr计算不准确的问题

还是那句话,没有十全十美的技术,那么LongAddr为什么会存在计算不准确的情况呢?

通过查看LongAddr的代码很容易可以发现一个问题,那就是LongAddr的累加结果可能是不准确的,而且sum这个方法的注释上也明确点处了这个问题:

Returns the current sum. The returned value is NOT an atomic snapshot; invocation in the absence of concurrent updates returns an accurate result, but concurrent updates that occur while the sum is being calculated might not be incorporated.

翻译过来就是:返回值不是原子快照;在没有并发更新的情况下调用会返回准确的结果,但是在计算总和时发生并发更新可能不会被纳入计算。举个极端的例子:在并发高的情况下,如果刚好返回sum的时候有其它原子操作进行了累加操作,那么这时候返回的sum就会不准。

总体来说,LongAddr在高并发情况下提供了更好的性能,但牺牲了计算的准确性,所以它更适合应用于并发竞争激烈,但对数据准确度要求并不是百分之百准确的场景,比如微博点赞、文章阅读量的统计等场景。

End:希望对大家有所帮助,如果有纰漏或者更好的想法,请您一定不要吝啬你的赐教 

你可能感兴趣的:(Java并发编程,1024程序员节,CAS实现原理,Atomic原子操作类,LongAddr,Unsafe类)