Java Concurrency代码实例之三原子变量

本文的读者应该是已经掌握了基本的Java多线程开发技巧,但不熟悉Java Concurrency包的程序员。本文是本系列的第三篇文章,前两篇文章请看这里:
https://zhuanlan.zhihu.com/p/26724352
https://zhuanlan.zhihu.com/p/27148381

1. 前言

按照用途与特性,Concurrency包中包含的工具被分为六类(外加一个工具类TimeUnit),即:
1. 执行者与线程池
2. 并发队列
3. 同步工具
4. 并发集合
5. 锁
6. 原子变量
本文介绍的是其中的原子变量,为什么调整介绍的顺序,是因为在写前两篇的时候意识到非阻塞并发的基础是CAS(CompareAndSwap,比较并替换,后面会详细介绍),而CAS的基础是Unsafe类,因此最好先找一个地方系统性的介绍一下Unsafe和CAS,这个地方就是原子变量类。

2. Java的指针Unsafe类

Java放弃了指针,获得了更高的安全性和内存自动清理的能力。但是,它还是在一个角落里提供了类似于指针的功能,那就是sun.misc.Unsafe类,利用这个类,可以完成许多需要指针才能提供的功能,例如构造一个对象,但是不调用构造函数;找到对象中一个变量的地址,然后直接给它赋值,无视其final属性;通过地址直接操作数组;或者是进行CAS操作。例子如下:

public class UnSafeExam {
    public static void main(String[] args) throws InstantiationException, NoSuchFieldException {
        //获得一个UnSafe实例
        Unsafe unsafe = null;
        try {
            Field f = Unsafe.class.getDeclaredField("theUnsafe");
            f.setAccessible(true);
            unsafe = (Unsafe) f.get(null);
        } catch (NoSuchFieldException e) {
            e.printStackTrace();
        } catch (IllegalAccessException e) {
            e.printStackTrace();
        }

        if (unsafe != null) {
            try {
                //构造一个对象,且不调用其构造函数
                Test test = (Test) unsafe.allocateInstance(Test.class);
                //得到一个对象内部属性的地址
                long x_addr = unsafe.objectFieldOffset(Test.class.getDeclaredField("x"));
                //直接给此属性赋值
                unsafe.getAndSetInt(test, x_addr, 47);
                System.out.println(test.getX());
            } catch (InstantiationException e) {
                e.printStackTrace();
            } catch (NoSuchFieldException e) {
                e.printStackTrace();
            }
        }

        //通过地址操作数组
        if (unsafe != null) {
            final int INT_BYTES = 4;
            int[] data = new int[10];
            System.out.println(Arrays.toString(data));
            long arrayBaseOffset = unsafe.arrayBaseOffset(int[].class);
            System.out.println("Array address is :" + arrayBaseOffset);
            unsafe.putInt(data, arrayBaseOffset, 47);
            unsafe.putInt(data, arrayBaseOffset + INT_BYTES * 8, 43);
            System.out.println(Arrays.toString(data));
        }

        //CAS
        if (unsafe != null) {
            Test test = (Test) unsafe.allocateInstance(Test.class);
            long x_addr = unsafe.objectFieldOffset(Test.class.getDeclaredField("x"));
            unsafe.getAndSetInt(test, x_addr, 47);
            unsafe.compareAndSwapInt(test, x_addr, 47, 78);
            System.out.println("After CAS:" + test.getX());
        }

    }

    static class Test {
        private final int x;

        Test(int x) {
            this.x = x;
            System.out.println("Test ctor");
        }

        int getX() {
            return x;
        }

    }
}

熟悉反射的人应该很快能够理解上面的代码,下面重点说说CAS这个操作。CAS即CompareAndSwap操作,在Unsafe中它有如下形式:

public final native boolean compareAndSwapObject(Object var1, long var2, Object var4, Object var5);

public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);

public final native boolean compareAndSwapLong(Object var1, long var2, long var4, long var6);

这三个方法都有四个参数,其中第一和第二个参数代表对象的实例以及地址,第三个参数代表期望值,第四个参数代表更新值。CAS的语义是,若期望值等于对象地址存储的值,则用更新值来替换对象地址存储的值,并返回true,否则不进行替换,返回false。
后面我们会看到诸多的原子变量,例如AtomicInteger、AtomicLong、AtomicReference等等都提供了CAS操作,其底层都是调用了Unsafe的CAS,它们的参数往往是三个,对象值、期望值和更新值,其语义也与Unsafe中的一致。
CAS是所有原子变量的原子性的基础,为什么一个看起来如此不自然的操作却如此重要呢?其原因就在于这个native操作会最终演化为一条CPU指令cmpxchg,而不是多条CPU指令。由于CAS仅仅是一条指令,因此它不会被多线程的调度所打断,所以能够保证CAS操作是一个原子操作。补充一点,当代的很多CPU种类都支持cmpxchg操作,但不是所有CPU都支持,对于不支持的CPU,会自动加锁来保证其操作不会被打断。
由此可知,原子变量提供的原子性来自CAS操作,CAS来自Unsafe,然后由CPU的cmpxchg指令来保证。

3. i++不是线程安全的

所谓“线程安全的”,意思是在多线程的环境下,多次运行,其结果是不变的,或者说其结果是可预知的。若某些对变量的操作不能保持原子性,则其操作就不是线程安全的。
为了说明原子性,来给出一个没有实现原子性的例子,例如i++这一条语句,它实际上会被编译为两条CPU指令,因此若一些线程在运行时被从中打断,就会造成不确定的后果,如下:

public class IplusplusExam {
    private volatile static int i = 0;

    public static void main(String[] args) throws InterruptedException {
        ExecutorService service = Executors.newCachedThreadPool();
        for (int j = 0; j < 10; j++) {
            service.execute(new Runnable() {
                @Override
                public void run() {
                    for (int k = 0; k < 10000; k++) {
                        i++;
                    }
                }
            });
        }
        service.shutdown();
        service.awaitTermination(1, TimeUnit.DAYS);
        System.out.println(i);
    }
}

十个线程分别对i变量进行10000次i++操作,若i++是线程安全的,则最终i应该等于100000,但是你会发现每次结果都不一样。

4. 保持原子性的AtomicInteger

若要保持一个变量改变数值时的原子性,目前Java最简单的方法就是使用相应的原子变量,例如AtomicInteger、AtomicBoolean和AtomicLong。再来看一个例子:

public class AtomicIntegerExam {
    public static void main(String[] args) throws InterruptedException {
        AtomicInteger atomicInteger = new AtomicInteger(0);
        ExecutorService service = Executors.newCachedThreadPool();
        for (int j = 0; j < 10; j++) {
            service.execute(new Runnable() {
                @Override
                public void run() {
                    for (int k = 0; k < 10000; k++) {
                        atomicInteger.incrementAndGet();
                    }
                }
            });
        }
        service.shutdown();
        service.awaitTermination(1, TimeUnit.DAYS);
        System.out.println(atomicInteger.get());
    }
}

这次的结果为保持为100000了。因为AtomicInteger的incrementAndGet()操作是原子性的。观察其内部代码,它使用了Unsafe的compareAndSwapInt()方法。
那么现在整形有AtomicInteger,长整型有AtomicLong,布尔型有AtomicBoolean,那么浮点型怎么办?JDK的说法是程序员可以利用AtomicInteger以及Float.floatToRawIntBits和Float.intBitsToFloat来自己实现一个AtomicFloat;利用AtomicLong以及Double.doubleToRawLongBits和Double.longBitsToDouble来自己实现一个AtomicDouble。在网上可以搜索到相应的实现https://my.oschina.net/apdplat/blog/418019,这里就不再赘述了。

5. 原子引用AtomicReference

Java的变量有两种类型,原始类型和引用类型。上一章讲了原始类型对应的原子变量,这一章讲的便是原子引用AtomicReference,它的作用就是能够实现对引用类型的原子化更改。例子如下:

public class AtomReferenceExam {
    public static void main(String[] args) throws InterruptedException {
        AtomicReference reference = new AtomicReference<>(new Element(0, 0));

        ExecutorService service = Executors.newCachedThreadPool();
        for (int i = 0; i < 10; i++) {
            service.execute(new Runnable() {
                @Override
                public void run() {
                    for (int j = 0; j < 10000; j++) {
                        boolean flag = false;
                        while (!flag) {
                            Element storedElement = reference.get();
                            Element newElement = new Element(storedElement.x + 1, storedElement.y + 1);
                            flag = reference.compareAndSet(storedElement, newElement);
                        }
                    }
                }
            });
        }
        service.shutdown();
        service.awaitTermination(1, TimeUnit.DAYS);
        System.out.println("element.x=" + reference.get().x + ",element.y=" + reference.get().y);
    }

    private static class Element {
        int x;
        int y;

        public Element(int x, int y) {
            this.x = x;
            this.y = y;
        }
    }
}

值得注意的有两点,一是如果有好几个变量要同时进行原子化的改变,那么可以把这几个变量放到一个Java类中,做成一个所谓的POJO(Plain Ordinary Java Object)类,然后使用AtomicReference来操作这个类。
第二点是以下这段代码:

boolean flag = false;
while (!flag) {
  Element storedElement = reference.get();
  Element newElement = new Element(storedElement.x + 1, storedElement.y + 1);
  flag = reference.compareAndSet(storedElement, newElement);
}

这是一种很通用的写法,在很多情况下,这种类似的写法都被称之为自旋锁(spinLock,我们会在后续的章节中介绍)。在使用AtomicReference的时候,会常常使用这种写法。

6. AtomicIntegerFieldUpdater

AtomicIntegerFieldUpdater、AtomicLongFieldUpdater和AtomicReferenceFieldUpdater都被称为原子属性更新器。这些类的应用场景是:如果已经有一个写好的类,但是随着业务场景的变化,其中某些属性在写入的时候需要保持原子性,那么就可以使用以上的类来实现这种原子性,并保持类的原有接口不变。
例子如下:

public class AtomicIntegerFieldUpdaterExam {
    public static void main(String[] args) throws InterruptedException {
        Student student = new Student(0, "Alex Wang");
        AtomicIntegerFieldUpdater updater = AtomicIntegerFieldUpdater.newUpdater(Student.class, "id");
        ExecutorService service = Executors.newCachedThreadPool();
        for (int i = 0; i < 10; i++) {
            service.execute(new Runnable() {
                @Override
                public void run() {
                    for (int j = 0; j < 10000; j++) {
                        updater.getAndIncrement(student);
                    }
                }
            });
        }
        service.shutdown();
        service.awaitTermination(1, TimeUnit.DAYS);
        System.out.println(student);
    }

    private static class Student {
        volatile int id;
        String name;

        public Student(int id, String name) {
            this.id = id;
            this.name = name;
        }

        @Override
        public String toString() {
            return "Student id = " + id + ",name = " + name;
        }
    }
}

上面的例子中给出了一个原有的类Student,其中属性id是volatile int(注意,要应用原子属性更新器的属性必须是volatile的),为了使这个属性能够被原子化的改变,我们创建了一个AtomicIntegerFieldUpdater,其构造方法为AtomicIntegerFieldUpdater.newUpdater(Student.class, “id”),注意第一个参数是一个class,而第二个参数是属性名字的字符串值(这里显然用到了反射)。接下来就可以使用这个Updater来更新属性值了,其用法类似于AtomicInteger。10个线程分别对这个属性进行了10000次加1操作,结果为100000。

7. AtomicIntegerArray原子数组

AtomicIntegerArray、AtomicLongArray和AtomicReferenceArray是原子数组,数组中每个元素在改变时都可以保持原子性。例子如下:

public class AtomicIntegerArrayExam {
    public static void main(String[] args) throws InterruptedException {
        AtomicIntegerArray array = new AtomicIntegerArray(5);
        array.set(0, 0);
        array.set(1, 0);
        ExecutorService service = Executors.newCachedThreadPool();
        for (int i = 0; i < 10; i++) {
            service.execute(new Runnable() {
                @Override
                public void run() {
                    for (int j = 0; j < 10000; j++) {
                        array.getAndIncrement(0);
                    }
                    for (int j = 0; j < 10000; j++) {
                        array.getAndIncrement(1);
                    }
                }
            });
        }
        service.shutdown();
        service.awaitTermination(1, TimeUnit.DAYS);
        System.out.println("array[0] = "+array.get(0)+", array[1] = "+array.get(1));
    }
}

10个线程分别对array[0]和array[1]进行了10000次加1操作,结果符合原子性。还有一点值得注意的是,为了性能考虑,应该尽量使用AtomicIntegerArray[n],而不是AtomicInteger[n],因为后者需要创建n个原子变量实例,而前者只需要创建一个原子变量数组实例,而完成的功能是一样的。

8. AtomicStampedReference带有版本号的原子引用

AtomicStampedReference和AtomicMarkableReference是atomic包中两个比较难以理解的类,它们都是为了解决ABA问题而创建出来的。

8.1 ABA问题

在介绍AtomicReference的时候已经说过,为了实现原子引用的原子性改变,需要用一种类似于自旋锁的代码写法,如下:

boolean flag = false;
while (!flag) {
  Element oldValue = reference.get();
  Element newValue = new Element(…);
//如果有其他线程在这里将oldValue从A改为B,做了一些事情,然后又将oldValue改为A,则下面的语句依然能够返回true
  flag = reference.compareAndSet(oldValue, newValue);
}

以上情况下,oldValue从A改为B,又从B改为A,不会影响compareAndSet的返回值。但是在某些情况下,会造成不确定的结果,因此影响了线程安全性,这种问题就叫做自旋锁的ABA问题,例如:
Java Concurrency代码实例之三原子变量_第1张图片
ABA问题一般存在于链表、栈这类的并发数据结构中。从上面的例子中可以看出,由于ABA问题,最后的结果是,在特定的条件下,一个ACD栈(三个元素),经过一个pop操作(线程1)变成了B(一个元素),这显然不是线程安全的。
下面的代码中,我模拟了这个例子(其中很多地方并未充分考虑并发的正确性,主要是为了展示ABA问题):

public class ABAProblem {
    public static void main(String[] args) throws InterruptedException {
        MyStack stack = new MyStack<>();
        stack.push("B");
        stack.push("A");
        System.out.println("Stack init:" + stack);

        ExecutorService service = Executors.newCachedThreadPool();
        service.execute(new Runnable() {
            @Override
            public void run() {
                Thread.currentThread().setName("Thread1");
                stack.pop();
                System.out.println("Thread1 pop :" + stack);
            }
        });
        service.execute(new Runnable() {
            @Override
            public void run() {
                Thread.currentThread().setName("Thread2");
                Node A = stack.pop();
                System.out.println("Thread2 pop :" + stack);
                stack.pop();
                System.out.println("Thread2 pop :" + stack);
                stack.push("D");
                System.out.println("Thread2 push D:" + stack);
                stack.push("C");
                System.out.println("Thread2 push C:" + stack);
                stack.push(A);
                System.out.println("Thread2 push A:" + stack);
            }
        });
        service.shutdown();
        service.awaitTermination(1, TimeUnit.DAYS);
        System.out.println("Stack result:" + stack);
    }

    static class MyStack {
        AtomicReference> head = new AtomicReference<>(null);

        public void push(T value) {
            Node node = new Node<>(value);
            push(node);
        }

        public void push(Node node) {
            for (; ; ) {
                Node tmpHead = head.get();
                if (head.compareAndSet(tmpHead, node)) {
                    node.setNext(tmpHead);
                    return;
                }
            }
        }

        public Node pop() {
            for (; ; ) {
                Node node = head.get();
                if (node == null) {
                    return null;
                }
                Node nextNode = node.getNext();
                // add this sleep to cause ABA problem
                if (Thread.currentThread().getName().equals("Thread1")) {
                    try {
                        TimeUnit.SECONDS.sleep(1);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                }
                if (head.compareAndSet(node, nextNode)) {
                    return node;
                }
            }
        }

        @Override
        public String toString() {
            StringBuilder sb = new StringBuilder("[");
            Node node = head.get();
            while (node != null) {
                sb.append(node.getValue());
                if (node.getNext() != null) {
                    sb.append(",");
                }
                node = node.getNext();
            }
            sb.append("]");
            return sb.toString();
        }
    }

    private static class Node {
        private T value;
        private Node next;

        public Node(T value) {
            this.value = value;
        }

        public Node getNext() {
            return next;
        }

        public void setNext(Node next) {
            this.next = next;
        }

        public T getValue() {
            return value;
        }

        public void setValue(T value) {
            this.value = value;
        }
    }
}

运行结果是:

Stack init:[A,B]
Thread2 pop :[B]
Thread2 pop :[]
Thread2 push D:[D]
Thread2 push C:[C,D]
Thread2 push A:[A,C,D]
Thread1 pop :[B]
Stack result:[B]

代码中的push和pop方法都用无限循环的for语句实现,这也是并发中的常见写法,与前面类似自旋锁的while语句实现类似的功能,但由于不需要定义一个boolean变量,因此更加简洁。为了保证ABA问题一定出现,我特意插入了一个针对特定线程的sleep语句。在现实中,出现ABA的几率其实是很小的。

8.2 用AtomicStampedReference解决ABA问题

ABA问题的实质是:在并发编程中,仅靠检查变量的值是无法知道这个变量是否被改动过的,还要加上一个版本号(当变量改变就改变其版本号)才能确定变量保持不变。AtomicStampedReference实现了此功能,它保存变量引用的同时,还赋予此变量一个版本号。每当变量改动时(这个改动是程序员自定义的,例如存储的数值改变,或者是变量在内存中的位置移动了,或者是变量在某一个数据结构中被移动了),AtomicStampedReference可以同时改动版本号;因此在进行CAS操作时,同时检查引用和版本号,只有同时符合才能成功。如此变可以确保ABA问题不会发生了。
代码进行如下改动(仅改动MyStack):

static class MyStack {
    //initialStamp = 0
    AtomicStampedReference> head = new AtomicStampedReference<>(null, 0);

    public void push(T value) {
        Node node = new Node<>(value);
        push(node);
    }

    public void push(Node node) {
        for (; ; ) {
            Node tmpHead = head.getReference();
            int stamp = head.getStamp();
            if (head.compareAndSet(tmpHead, node, stamp, stamp + 1)) {
                node.setNext(tmpHead);
                return;
            }
        }
    }

    public Node pop() {
        for (; ; ) {
            Node node = head.getReference();
            int stamp = head.getStamp();
            if (node == null) {
                return null;
            }
            Node nextNode = node.getNext();

            // add this sleep to cause ABA problem
            if (Thread.currentThread().getName().equals("Thread1")) {
                try {
                    TimeUnit.SECONDS.sleep(1);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
            }
            if (head.compareAndSet(node, nextNode, stamp, stamp + 1)) {
                return node;
            }
        }
    }

    @Override
    public String toString() {
        StringBuilder sb = new StringBuilder("[");
        Node node = head.getReference();
        while (node != null) {
            sb.append(node.getValue());
            if (node.getNext() != null) {
                sb.append(",");
            }
            node = node.getNext();
        }
        sb.append("]");
        return sb.toString();
    }
}

在每次改动head保存的变量时,都同时给版本号加1,这样就避免了ABA问题的发生,运行结果如下:

Stack init:[A,B]
Thread2 pop :[B]
Thread2 pop :[]
Thread2 push D:[D]
Thread2 push C:[C,D]
Thread2 push A:[A,C,D]
Thread1 pop :[C,D]
Stack result:[C,D]

另外值得一提的是,AtomicStampedReference还有一个简化版AtomicMarkableReference,它保存的版本号是一个boolean值,适用于某些简化的情景下。

9. 小结

所谓“线程安全的”,就是在并发环境下能够保持运行结果不变。除了原始的synchronize阻塞方法外,使用原子性的语句能够在保持线程安全的前提下提供更好的性能。原子性的基础是CAS语句,而它则是由Unsafe类提供的。有了此利器,JDK提供了AtomicInteger、AtomicBoolean和AtomicLong等类来实现整形、布尔型和长整型变量的原子增减操作;提供了AtomicReference来实现引用类型的原子操作;提供了AtomicIntegerFieldUpdater、AtomicLongFieldUpdater和AtomicReferenceFieldUpdater来实现原有类中某个属性的原子更新操作;提供了AtomicIntegerArray、AtomicLongArray和AtomicReferenceArray等原子数组,数组中每个元素在改变时都可以保持原子性。为了避免ABA问题,提供了AtomicStampedReference和AtomicMarkableReference。

你可能感兴趣的:(java,并发,多线程,程序员,编程技巧,Java技术)