【JUC系列-02】深入理解CAS底层原理和基本使用

JUC系列整体栏目


内容 链接地址
【一】深入理解JMM内存模型的底层实现原理 https://zhenghuisheng.blog.csdn.net/article/details/132400429
【二】深入理解CAS底层原理和基本使用 https://blog.csdn.net/zhenghuishengq/article/details/132478786
【三】熟练掌握Atomic原子系列基本使用 https://blog.csdn.net/zhenghuishengq/article/details/132543379
【四】精通Synchronized底层的实现原理 https://blog.csdn.net/zhenghuishengq/article/details/132740980
【五】通过源码分析AQS和ReentrantLock的底层原理 https://blog.csdn.net/zhenghuishengq/article/details/132857564

深入理解cas的底层原理和基本使用

  • 一,深入理解cas底层的执行原理
    • 1,什么是cas
    • 2,cas的自旋原理
    • 3,cas的底层实现原理
    • 4,cas的缺陷以及不足
      • 4.1,长时间自旋耗费cpu资源
      • 4.2,只能有一个共享变量的操作
      • 4.4,ABA问题
    • 5,通过Atomic举例cas
    • 6,总结

一,深入理解cas底层的执行原理

1,什么是cas

在讲底层原理之前,一定需要先了解JMM的内存模型以及多线程的通信机制,可以查看我写的前几篇文章。

Compare And Swap:顾名思义,就是比较与交换的意思。cas是一个指令,底层是一个无锁的算法,可以在并发场景中保证数据的原子性。

cas主要是针对某一个变量,对该值在不同线程位置的比较与交换,通过自旋的方式,实现主内存值,工作内存的旧值和工作内存的新值直接的操作,通过比较主内存的变量值和工作内存的初始值是否相等,来判断是否可以将工作内存的新值对主内存的值进行替换的操作。cas的比较与交换是一个原子操作,要么同时成功,要么同时失败。

但是cas并不是在java层面直接去实现,而是要借助于硬件底层去实现,如下面一些常见的比较与交换的方法中,都是通过调用native方法区实现的。

public final native boolean compareAndSwapObject(Object var1, long var2, Object var4, Object var5);

public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);

public final native boolean compareAndSwapLong(Object var1, long var2, long var4, long var6);

而上面的四个参数,分别对应的是:对象,偏移量,工作内存初始值,工作内存新值

2,cas的自旋原理

接下来先举一个例子,假设此时主内存中有一个值x等于10,然后有三个工作线程thread1,thread2,thread3,用K表示主内存中的x,用M表示工作线程中的x,用N表示工作线程修改后的值,假设此时三个工作线程同时去对这个工作线程的x的值做一个类加操作,在用cas的情况下,来讲一下底层的实现逻辑

假设此时线程thread1获取到了这个x值,此时线程thread1的M值为10,N值为11,随后进行比较操作,如果此时主内存的值还是10,那么CAS就会认为此时还没有线程改过这个值,此时M的值等于K,比较成功后再进行交换,此时工作内存的K对应的x值就是11

但是可能也会出现另外一种情况,此时线程thread1中M的值还是10,N为11,但是此时线程2先对主内存的值进行修改,就是此时K的值变成了11,在比较的时候,发现旧值M和主内存的K值不一样,那么就比较失败,那么就不能进行交换

如果此时直接将这次失败直接丢弃,那么很显然不能保证cas的原子性,cas内部是这样做的,他会携带最新的值继续自旋,此时线程1的M值变成了11,N值变成了12,M值再和K值相比,如果比较一致,则将最新的12交换,如果比较失败,则继续携带最新值轮询,一直重复下去,这样就能保证原子性了

【JUC系列-02】深入理解CAS底层原理和基本使用_第1张图片

再了解完整个代码流程之后,再来看一段AtomicInteger类的incrementAndGet()的自增操作

//var1:对象        var2:偏移量,找到对应的变量值
//var4:值1         var5:内存中的值,旧值
public final int getAndAddInt(Object var1, long var2, int var4) {
    int var5;
    do {
        //获取旧值,内存中的值
        var5 = this.getIntVolatile(var1, var2);
        //比较与交换,如果var5和var1的值相对,则将最新值var5+var4写回
    } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
	//将旧值返回,返回后进行+1操作
    return var5;
}

3,cas的底层实现原理

cas是一个指令,具体如何实现的,这就得看jvm层面的逻辑了。由于这个涉及到多线程之间的通信问题,因此需要考虑线程间的可见性和有序性,在hotspot虚拟机中,由于cas本身就是一个原子指令,所以在jvm底层,就直接在方法中加了一个 #lock 的前缀指令,这样就实现了一个类似于内存屏障的功能,这样就保证了线程之间的有序性和可见性。

public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);

这里的第二个参数是一个偏移量,通过第一个参数的对象头加上压缩指针来确认x的位置。

在Hotspot虚拟机的底层源码中,主要的核心cas算法是通过Atomic::cmpxchg 方法来实现的。在这个方法中,第一个参数是要交换的值,第二个参数是偏移量,第三个参数是比较的值

#atomic_linux_x86.inline.hpp
inline jint Atomic::cmpxchg(jint exchange_value, volatile jint* dest, jint compare_value) {
  int mp = os::is_MP();
  __asm__ volatile (LOCK_IF_MP(%4) "cmpxchgl %1,(%3)"
            : "=a" (exchange_value)
            : "r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp)
            : "cc", "memory");
  return exchange_value;

首先会判断当前的执行环境是否为多处理器环境,目前一个cpu中基本是有两个处理器的

int mp = os::is_MP();

如果上面判断是一个多核处理器架构,那么就会在方法前面加一个 Lock 前缀指令,这样就保证了后面的比较与交换之间的原子性

(LOCK_IF_MP(%4)

随后通过cmpxchg方法进行比较与交换的操作,这里的%1和%3代表的是第1个和第三个参数。并且在调用这个方法的时候,在操作系统底层会进行一个总线加锁的机制,就是一把独占锁,整体操作变成一个串行操作。

cmpxchgl %1,(%3)

如果是=a,那么代表比较与交换成功,则直接将exchange_value值返回

"=a" (exchange_value)

如果是r,那么就代表比较与交换失败,那么返回的值就是内存里面的值

"r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp)

上面的源码是linux_x86系统的源码,不同的操作系统之间,其底层实现也不同

4,cas的缺陷以及不足

4.1,长时间自旋耗费cpu资源

cas是通过无锁算法来保证数据的同步的,synchronized,lock等是通过加锁的方式来保证数据的同步的,并且要涉及到用户态和内核态之间的来回切换,但是cas是不需要来回切换的,而是不断的自旋加配合底层硬件来解决

但是cas也会出现一个问题,在并发量比较大的时候,就会需要不断的进行自旋的操作,此时就会占用大量的cpu,从而影响整个系统的性能和效率。因此需要通过不同的场景来判断是否使用CAS

4.2,只能有一个共享变量的操作

虽然上面谈到了比较和交换的操作,但是整个流程都是围绕一个对象来进行的,如果存在多个对象就得多写几个cas的程序,这也是cas的一个缺陷。

4.4,ABA问题

依旧是下图,假设thread1获取到值,此时thread2也拿到了值,将值改成11,比较交换之后,此时主内存的值为11,但是thread3拿到值后,又通过比较交换将值改成了10,此时正好轮到thread1来进行比较交换,发现主内存的值和thread1的原始值是一样的,就认为此时还没有线程改了这个值,于是进行比较交换操作

【JUC系列-02】深入理解CAS底层原理和基本使用_第2张图片

其实是已经被别的线程将值修改了,但是当前线程认为该值还没有被修改过。

如男女朋友分手了,但是女方又恋爱了,又分手,然后男方再次找到女方,发现女方还是单身,男方就认为这段时间女方没有恋爱,但是女方期间谈了多少次男方并不知情,并且可能给男方带回一个小朋友…,所以说,这种问题是很严重的

那么如何解决这种ABA问题,直接看Atomic里面是怎么解决的吧,在Atomic包下面有一个AtomicStampedReference 类,在该类中有一个静态内部类 Pair,里面除了一个对象的引用之外,另外增加了一个stamp的一个版本,这个有点类似于乐观锁,每被操作一次,版本号就加1,通过这种加版本号来保证这个变量是否被更改过。

private static class Pair<T> {
    final T reference;
    final int stamp;
    private Pair(T reference, int stamp) {
        this.reference = reference;
        this.stamp = stamp;
    }
    static <T> Pair<T> of(T reference, int stamp) {
        return new Pair<T>(reference, stamp);
    }
}

其创建对象的方式如下,第一个参数表示初始值,第二个参数表示版本。

AtomicStampedReference atomicStampedReference = new AtomicStampedReference(1,1);
// 构造方法如下
public AtomicStampedReference(V initialRef, int initialStamp) {
    pair = Pair.of(initialRef, initialStamp);
}

当然了,除了加版本号之外,还有一个加标记的方式解决,其原理很简单,就是只要被加载过,那么就给他一个mark标记,在atomic原子包下面就有这么一个类 AtomicMarkableReference

public class AtomicMarkableReference {
    private static class Pair {
        final T reference;
        final boolean mark;
        private Pair(T reference, boolean mark) {
            this.reference = reference;
            this.mark = mark;
        }
        static  Pair of(T reference, boolean mark) {
            return new Pair(reference, mark);
        }
    }
}

在里面的静态内部类中,除了引用之外,还存在一个布尔类型的mark标志位,只有被加载过,那么就对这个标志位设置一个true。

5,通过Atomic举例cas

首先定义一个AtomicInteger的原子类,随后进行一个值更新的操作

//这里初始化为0,这个0是当前线程的初始值
AtomicInteger atomicInteger = new AtomicInteger(0);
// 0是主内存中的最新值,10是要更新的值
atomicInteger.compareAndSet(0,10);

随后再次分析这个compareAndSet方法,可以发现里面调用了这个compareAndSwapInt方法

public final boolean compareAndSet(int expect, int update) {
    //比较与交换
    return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
}

如果主内存的最新值和当前线程的初始值一致,则进行更新的操作,否则携带最新值继续进行自旋的操作。

6,总结

cas比较和交换,通过jmm的java内存模型,借助于自旋的方式不断的去进行比较与交换,在每个对象的比较与交换中,主要是通过调用jvm的native本地方法去实现,从而去调用操作系统,在操作系统底层,cas借助了锁总线的串行方法来保证整个命令的原子操作,从而可以保证最终结果的一致性。

相对于其他的重锁,cas底层采用的是无锁算法,通过#lock前缀指令达到内存屏障的效果,从而保证数据的可见性,一致性和有序性,其内部需要花费的时间,也远远小于其他的重锁,如synchronized等。

你可能感兴趣的:(JUC系列,java,JUC,CAS,内存屏障,cmpxchg,Atomic,并发编程)