无锁 --- 乐观锁(非阻塞)
共享模式之无锁
- CAS 与 volatile
- 原子整数
- 原子引用
- 原子累加器
- Unsafe
CAS无锁方案
CAS无锁主要看重三个变量: 预估值 + 修改值 + 主存值
预估值: 主要用来判断是否等于主存值, 是则将修改值修改到主存值中
修改值: 即将需要修改的新值, 修改到主存中
主存值: 实际值
class AccountSafe implements Account {
// 主存值, 其内部的 value 使用的就是 volatile
private AtomicInteger balance;
public AccountSafe(Integer balance) {
this.balance = new AtomicInteger(balance);
}
@Override
public Integer getBalance() {
return balance.get();
}
@Override
public void withdraw(Integer amount) {
while (true) {
// 希望值
int prev = balance.get();
// 修改值
int next = prev - amount;
if (balance.compareAndSet(prev, next)) {
break;
}
}
// 可以简化为下面的方法
// balance.addAndGet(-1 * amount);
}
public static void main(String[] args) {
Account.demo(new AccountSafe(10000));
}
}
其中的关键是 compareAndSet,它的简称就是 CAS (也有 Compare And Swap 的说法),它必须是原子操作
**注意: **
- 其实 CAS 的底层是 lock cmpxchg 指令(X86 架构),在单核 CPU 和多核 CPU 下都能够保证【比较-交
换】的原子性 - 在多核状态下,某个核执行到带 lock 的指令时,CPU 会让总线锁住,当这个核把此指令执行完毕,再
开启总线。这个过程中不会被线程的调度机制所打断,保证了多个线程对内存操作的准确性,是原子
的。
CAS 与 volatile
为什么需要volatile? 其实很简单, 就是借助 volatile 关键字获取主存中的值, 如果使用, 则获取的值可能不是主存中的值
public class ConcurrentcyAtomicInteger {
// 请求总数
public static final int clientTotal = 5000;
// 高并发数量
public static final int threadTotal = 200;
public static volatile int count = 0;
// public static AtomicInteger count = new AtomicInteger(0);
public static void main(String[] args) {
ExecutorService executorService = Executors.newCachedThreadPool();
Semaphore semaphore = new Semaphore(threadTotal);
CountDownLatch countDownLatch = new CountDownLatch(clientTotal);
for (int i = 0; i < clientTotal; i++) {
executorService.execute(() -> {
try {
semaphore.acquire();
} catch (InterruptedException e) {
e.printStackTrace();
}
add();
semaphore.release();
});
countDownLatch.countDown();
}
try {
countDownLatch.await();
} catch (InterruptedException e) {
e.printStackTrace();
}
executorService.shutdown();
System.out.println("count = " + count);
}
private synchronized static void add() {
count++;
}
}
volatile
获取共享变量时,为了保证该变量的可见性,需要使用 volatile 修饰。
它可以用来修饰成员变量和静态成员变量,他可以避免线程从自己的工作缓存中查找变量的值,必须到主存中获取它的值,线程操作 volatile 变量都是直接操作主存。即一个线程对 volatile 变量的修改,对另一个线程可见。
注意
volatile 仅仅保证了共享变量的可见性,让其它线程能够看到最新值,但不能解决指令交错问题(不能保证原子性)
CAS 必须借助 volatile 才能读取到共享变量的最新值来实现【比较并交换】的效果
为什么需要无锁???
- 无锁情况下,即使重试失败,线程始终在高速运行,没有停歇,而 synchronized 会让线程在没有获得锁的时
候,发生上下文切换,进入阻塞。打个比喻 - 线程就好像高速跑道上的赛车,高速运行时,速度超快,一旦发生上下文切换,就好比赛车要减速、熄火,
等被唤醒又得重新打火、启动、加速... 恢复到高速运行,代价比较大 - 但无锁情况下,因为线程要保持运行,需要额外 CPU 的支持,CPU 在这里就好比高速跑道,没有额外的跑
道,线程想高速运行也无从谈起,虽然不会进入阻塞,但由于没有分到时间片,仍然会进入可运行状态,还
是会导致上下文切换
总结:
上下文切换代价比线程循环代价来得大, 所以选择了CAS
CAS合适竞争条件不激烈的环境, 如果激烈的话, 会出现很多线程 '死循环' 的情况
原子整数
AtomicInteger
AtomicBoolean
AtomicLong
以 AtomicInteger 为例
class Zhazha {
public static void main(String[] args) {
AtomicInteger i = new AtomicInteger(0);
// 获取并自增(i = 0, 结果 i = 1, 返回 0),类似于 i++
System.out.println(i.getAndIncrement());
// 自增并获取(i = 1, 结果 i = 2, 返回 2),类似于 ++i
System.out.println(i.incrementAndGet());
// 自减并获取(i = 2, 结果 i = 1, 返回 1),类似于 --i
System.out.println(i.decrementAndGet());
// 获取并自减(i = 1, 结果 i = 0, 返回 1),类似于 i--
System.out.println(i.getAndDecrement());
// 获取并加值(i = 0, 结果 i = 5, 返回 0)
System.out.println(i.getAndAdd(5));
// 加值并获取(i = 5, 结果 i = 0, 返回 0)
System.out.println(i.addAndGet(-5));
// 获取并更新(i = 0, p 为 i 的当前值, 结果 i = -2, 返回 0)
// 其中函数中的操作能保证原子,但函数需要无副作用
System.out.println(i.getAndUpdate(p -> p - 2));
// 更新并获取(i = -2, p 为 i 的当前值, 结果 i = 0, 返回 0)
// 其中函数中的操作能保证原子,但函数需要无副作用
System.out.println(i.updateAndGet(p -> p + 2));
// 获取并计算(i = 0, p 为 i 的当前值, x 为参数1, 结果 i = 10, 返回 0)
// 其中函数中的操作能保证原子,但函数需要无副作用
// getAndUpdate 如果在 lambda 中引用了外部的局部变量,要保证该局部变量是 final 的
// getAndAccumulate 可以通过 参数1 来引用外部的局部变量,但因为其不在 lambda 中因此不必是 final
System.out.println(i.getAndAccumulate(10, (p, x) -> p + x));
// 计算并获取(i = 10, p 为 i 的当前值, x 为参数1, 结果 i = 0, 返回 0)
// 其中函数中的操作能保证原子,但函数需要无副作用
System.out.println(i.accumulateAndGet(-10, (p, x) -> p + x));
}
}
原子引用
为什么需要原子引用类型?
- AtomicReference
- AtomicMarkableReference
- AtomicStampedReference
有如下方法
public interface DecimalAccount {
// 获取余额
BigDecimal getBalance();
// 取款
void withdraw(BigDecimal amount);
/**
* 方法内会启动 1000 个线程,每个线程做 -10 元 的操作
* 如果初始余额为 10000 那么正确的结果应当是 0
*/
static void demo(DecimalAccount account) {
List ts = new ArrayList<>();
for (int i = 0; i < 1000; i++) {
ts.add(new Thread(() -> {
account.withdraw(BigDecimal.TEN);
}));
}
ts.forEach(Thread::start);
ts.forEach(t -> {
try {
t.join();
} catch (InterruptedException e) {
e.printStackTrace();
}
});
System.out.println(account.getBalance());
}
}
不安全实现
class DecimalAccountUnsafe implements DecimalAccount {
BigDecimal balance;
public DecimalAccountUnsafe(BigDecimal balance) {
this.balance = balance;
}
@Override
public BigDecimal getBalance() {
return balance;
}
@Override
public void withdraw(BigDecimal amount) {
BigDecimal balance = this.getBalance();
this.balance = balance.subtract(amount);
}
}
安全实现-使用锁
class DecimalAccountSafeLock implements DecimalAccount {
private final Object lock = new Object();
BigDecimal balance;
public DecimalAccountSafeLock(BigDecimal balance) {
this.balance = balance;
}
@Override
public BigDecimal getBalance() {
return balance;
}
@Override
public void withdraw(BigDecimal amount) {
synchronized (lock) {
BigDecimal balance = this.getBalance();
this.balance = balance.subtract(amount);
}
}
}
安全实现-使用 CAS
class DecimalAccountSafeCas implements DecimalAccount {
AtomicReference ref;
public DecimalAccountSafeCas(BigDecimal balance) {
ref = new AtomicReference<>(balance);
}
@Override
public BigDecimal getBalance() {
return ref.get();
}
@Override
public void withdraw(BigDecimal amount) {
while (true) {
BigDecimal prev = ref.get();
BigDecimal next = prev.subtract(amount);
if (ref.compareAndSet(prev, next)) {
break;
}
}
}
}
测试代码:
DecimalAccount.demo(new DecimalAccountUnsafe(new BigDecimal("10000")));
DecimalAccount.demo(new DecimalAccountSafeLock(new BigDecimal("10000")));
DecimalAccount.demo(new DecimalAccountSafeCas(new BigDecimal("10000")));
运行结果
4310 cost: 425 ms
0 cost: 285 ms
0 cost: 274 ms
ABA 问题及解决
ABA是什么?
cas存在一种情况就是在对比过程前, 主存的值被瞬间做了两次修改, 恰巧第二次修改的值和修改前的值相同, 这样导致回到对比过程时, cas无法发现它已经被修改过了
AtomicStampedReference
AtomicMarkableReference
@Slf4j
public class AtomicStampedReferenceDemo {
static AtomicStampedReference ref = new AtomicStampedReference<>("A", 0);
public static void main(String[] args) throws Exception {
log.debug("ref = {}", ref.getReference());
String prev = ref.getReference();
int stamp = ref.getStamp();
other();
Sleeper.sleep(1000);
log.debug("ref A -> B {}", ref.compareAndSet("A", "B", stamp, stamp + 1));
}
private static void other() {
new Thread(() -> {
int stamp = ref.getStamp();
log.debug("ref A -> B {}", ref.compareAndSet("A", "B", stamp, ++stamp));
}).start();
new Thread(() -> {
int stamp = ref.getStamp();
log.debug("ref B -> A {}", ref.compareAndSet("B", "A", stamp, ++stamp));
}).start();
}
}
@Slf4j
public class AtomicMarkableReferenceDemo {
public static void main(String[] args) throws Exception {
GarbageBag garbageBag = new GarbageBag("装满了垃圾的垃圾袋");
AtomicMarkableReference reference = new AtomicMarkableReference<>(garbageBag, true);
log.debug("主线程 start...");
GarbageBag prev = reference.getReference();
log.debug(prev.toString());
new Thread(() -> {
log.debug("打扫卫生的线程 start...");
garbageBag.setDesc("空垃圾袋");
while (!reference.compareAndSet(garbageBag, garbageBag, true, false)) {
}
log.debug(garbageBag.toString());
}).start();
Thread.sleep(1000);
log.debug("主线程想换一只新垃圾袋?");
boolean success = reference.compareAndSet(prev, new GarbageBag("空垃圾袋"), true, false);
log.debug("换了么?" + success);
log.debug(reference.getReference().toString());
}
}
原子数组
- AtomicIntegerArray
- AtomicLongArray
- AtomicReferenceArray
@Slf4j
public class AtomicIntegerArrayDemo {
public static void main(String[] args) throws Exception {
demo(() -> new int[10], ints -> ints.length, (ints, integer) -> ints[integer]++, ints -> System.out.println(Arrays.toString(ints)));
demo(() -> new AtomicIntegerArray(10), AtomicIntegerArray::length, AtomicIntegerArray::getAndIncrement, System.out::println);
}
private static void demo(Supplier arraySupplier, Function lengthFun, BiConsumer putConsumer, Consumer printConsumer) {
List ts = new ArrayList<>();
T array = arraySupplier.get();
Integer len = lengthFun.apply(array);
for (int i = 0; i < len; i++) {
ts.add(new Thread(() -> {
for (int j = 0; j < 10000; j++) {
putConsumer.accept(array, j % len);
}
}));
}
ts.forEach(Thread::start);
ts.forEach(thread -> {
try {
thread.join();
} catch (InterruptedException e) {
e.printStackTrace();
}
});
printConsumer.accept(array);
}
}
字段更新器
- AtomicReferenceFieldUpdater // 域 字段
- AtomicIntegerFieldUpdater
- AtomicLongFieldUpdater
@Slf4j
public class AtomicReferenceFieldUpdaterDemo {
public static void main(String[] args) throws Exception {
Student student = new Student("zhazha");
AtomicReferenceFieldUpdater updater = AtomicReferenceFieldUpdater.newUpdater(Student.class, String.class, "name");
System.err.println(updater.compareAndSet(student, "zhazha", "heihei"));
}
static class Student {
private volatile String name;
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
@Override
public String toString() {
return "Student{" + "name='" + name + '\'' + '}';
}
public Student(String name) {
this.name = name;
}
}
}
原子累加器
累加器性能比较
@Slf4j
public class AtomicLongLongAdderDemo {
public static void main(String[] args) throws Exception {
for (int i = 0; i < 5; i++) {
AtomicLongLongAdderDemo.demo(() -> new AtomicLong(0), AtomicLong::getAndIncrement);
}
System.out.println("---------------------------------------------------------------");
for (int i = 0; i < 5; i++) {
AtomicLongLongAdderDemo.demo(LongAdder::new, LongAdder::increment);
}
}
private static void demo(Supplier adderSupplier, Consumer action) {
T adder = adderSupplier.get();
List ts = new ArrayList<>();
Instant start = Instant.now();
// 四核系统, 所以我们这里使用4条线程 突破到 cas 最快的速度
for (int i = 0; i < 4; i++) {
ts.add(new Thread(() -> {
for (int j = 0; j < 500000; j++) {
action.accept(adder);
}
}));
}
ts.forEach(Thread::start);
ts.forEach(thread -> {
try {
thread.join();
} catch (InterruptedException e) {
e.printStackTrace();
}
});
Instant end = Instant.now();
Duration duration = Duration.between(start, end);
System.out.println(adder + " cost: " + duration.toMillis());
}
}
2000000 cost: 34
2000000 cost: 23
2000000 cost: 33
2000000 cost: 26
2000000 cost: 39
---------------------------------------------------------------
2000000 cost: 50
2000000 cost: 25
2000000 cost: 13
2000000 cost: 16
2000000 cost: 20
毫无疑问, LongAdder效率铁定比AtomicLong快
在存在高度竞争的条件下,LongAdder的性能会远远好于AtomicLong,不过会消耗更多空间。高度竞争当然是指在多线程条件下。(cas推荐在cpu多少核就创建多少来实现累加)
性能提升的原因很简单,就是在有竞争时,设置多个累加单元,Therad-0 累加 Cell[0]
,而 Thread-1 累加 Cell[1]
... 最后将结果汇总。这样它们在累加时操作的不同的 Cell 变量,因此减少了 CAS 重试失败,从而提高性能。
LongAdder底层原理
@Slf4j
public class LockCasDemo {
public static void main(String[] args) throws Exception {
LockCas lockCas = new LockCas();
new Thread(() -> {
log.debug("{}运行了", Thread.currentThread().getName());
try {
lockCas.lock();
log.debug("{} lock...", Thread.currentThread().getName());
Sleeper.sleep(1000);
} finally {
lockCas.unlock();
}
}).start();
new Thread(() -> {
log.debug("{}运行了", Thread.currentThread().getName());
try {
lockCas.lock();
log.debug("{} lock...", Thread.currentThread().getName());
} finally {
lockCas.unlock();
}
}).start();
}
/**
* 生产环境最好别这样用
*/
static class LockCas {
private AtomicInteger state = new AtomicInteger(0);
public void lock() {
while (true) {
if (state.compareAndSet(0, 1)) {
break;
}
}
}
public void unlock() {
log.debug("unlock ...");
state.set(0);
}
}
}
18:51:37.250 [Thread-1] DEBUG c.lockCasDemo - Thread-1运行了
18:51:37.275 [Thread-1] DEBUG c.lockCasDemo - Thread-1 lock...
18:51:37.275 [Thread-1] DEBUG c.lockCasDemo - unlock ...
18:51:37.250 [Thread-0] DEBUG c.lockCasDemo - Thread-0运行了
18:51:37.276 [Thread-0] DEBUG c.lockCasDemo - Thread-0 lock...
18:51:38.279 [Thread-0] DEBUG c.lockCasDemo - unlock ...
伪共享和缓存行
伪共享问题的表现是:并发的修改在一个缓存行中的多个独立变量,看起来是并发执行的,但实际在CPU处理的时候,是串行执行的,并发的性能大打折扣。
伪共享的原因就是 CPU 在 Invalid
的时候,是会直接废除一行的!
如果 两个变量 (a,b)
同时在一个 Cache Line
中,处理器A
修改了变量a
,那么处理器B中,这个 CacheLine
失效了,这个时候如果处理器B
修改了变量b
的话,就必须先提交处理器A
的缓存,然后处理器B
再去主存中读取数据!这样就出现了问题,a
和b
在两个处理器上被修改,本应该是一个并行的操作,但是由于缓存一致性,却成为了串行!这样会严重的影响并发的性能!
// 防止缓存行伪共享
@sun.misc.Contended
static final class Cell {
volatile long value;
Cell(long x) { value = x; }
// 最重要的方法, 用来 cas 方式进行累加, prev 表示旧值, next 表示新值
final boolean cas(long prev, long next) {
return UNSAFE.compareAndSwapLong(this, valueOffset, prev, next);
}
// 省略不重要代码
}
因为 CPU 与 内存的速度差异很大,需要靠预读数据至缓存来提升效率。
而缓存以缓存行为单位,每个缓存行对应着一块内存,一般是 64 byte(8 个 long)
缓存的加入会造成数据副本的产生,即同一份数据会缓存在不同核心的缓存行中
CPU 要保证数据的一致性,如果某个 CPU 核心更改了数据,其它 CPU 核心对应的整个缓存行必须失效
因为 Cell 是数组形式,在内存中是连续存储的,一个 Cell 为 24 字节(16 字节的对象头和 8 字节的 value),因此缓存行可以存下 2 个的 Cell 对象。这样问题来了:
- Core-0 要修改
Cell[0]
- Core-1 要修改
Cell[1]
无论谁修改成功,都会导致对方 Core 的缓存行失效,比如 Core-0 中 Cell[0]=6000
, Cell[1]=8000
要累加
Cell[0]=6001
, Cell[1]=8000
,这时会让 Core-1 的缓存行失效
@sun.misc.Contended 用来解决这个问题,它的原理是在使用此注解的对象或字段的前后各增加 128 字节大小的
padding,从而让 CPU 将对象预读至缓存时占用不同的缓存行,这样,不会造成对方缓存行的失效
累加主要调用下面的方法
源码分析:
class Zhazha {
public void add(long x) {
Cell[] cs; long b, v; int m; Cell c;
if ((cs = cells) != null || !casBase(b = base, b + x)) {
boolean uncontended = true;
if (cs == null || (m = cs.length - 1) < 0 ||
(c = cs[getProbe() & m]) == null ||
!(uncontended = c.cas(v = c.value, v + x)))
longAccumulate(x, null, uncontended);
}
}
}
但是缺点也能多
class Zhazha {
public long sum() {
Cell[] cs = cells;
long sum = base;
if (cs != null) {
for (Cell c : cs)
if (c != null)
sum += c.value;
}
return sum;
}
}
它不能保证sum在高并发情况下的正确性
Unsafe
Unsafe 对象提供了非常底层的,操作内存、线程的方法,Unsafe 对象不能直接调用,只能通过反射获得
public class UnsafeAccessor {
private static final Unsafe unsafe;
static {
try {
Field theUnsafe = Unsafe.class.getDeclaredField("theUnsafe");
theUnsafe.setAccessible(true);
unsafe = (Unsafe) theUnsafe.get(null);
} catch (Exception e) {
throw new RuntimeException(e);
}
}
public static Unsafe getUNSAFE() {
return unsafe;
}
}
Unsafe CAS 操作
@Slf4j
public class GetUnsafeObjectDemo {
public static void main(String[] args) throws Exception {
Field theUnsafe = Unsafe.class.getDeclaredField("theUnsafe");
theUnsafe.setAccessible(true);
Unsafe unsafe = (Unsafe) theUnsafe.get(null);
long idOffset = unsafe.objectFieldOffset(Student.class.getDeclaredField("id"));
long nameOffset = unsafe.objectFieldOffset(Student.class.getDeclaredField("name"));
Student student = new Student();
unsafe.compareAndSwapInt(student, idOffset, 0, 1);
unsafe.compareAndSwapObject(student, nameOffset, null, "zhazha");
System.out.println(student);
}
@Data
static class Student {
private int id;
private String name;
}
}
使用自定义的 AtomicData 实现之前线程安全的原子整数 Account 实现
public interface Account {
int getBalance();
void withdraw(int amount);
static void doSomething(Account account) {
List ts = new ArrayList<>();
for (int i = 0; i < 1000; i++) {
ts.add(new Thread(() -> {
account.withdraw(10);
}));
}
ts.forEach(Thread::start);
ts.forEach(thread -> {
try {
thread.join();
} catch (InterruptedException e) {
e.printStackTrace();
}
});
System.out.println("余额: " + account.getBalance());
}
}
public class MyAtomicIntegerDemo {
public static void main(String[] args) {
Account.doSomething(new MyAtomicInteger(10000));
}
}
class MyAtomicInteger implements Account {
private volatile int value;
private final static long valueOffset;
private final static Unsafe UNSAFE;
static {
UNSAFE = UnsafeAccessor.getUNSAFE();
try {
valueOffset = UNSAFE.objectFieldOffset(MyAtomicInteger.class.getDeclaredField("value"));
} catch (NoSuchFieldException e) {
throw new RuntimeException(e);
}
}
public MyAtomicInteger(int value) {
this.value = value;
}
@Override
public int getBalance() {
return value;
}
@Override
public void withdraw(int amount) {
while (true) {
int prev = value;
int next = prev - amount;
if (UNSAFE.compareAndSwapInt(this, valueOffset, prev, next)) {
break;
}
}
}
}
MethodHandlers类的使用(这个类和unsafe很像)
这个类据说是官方为了防止别人擅自使用unsafe
而产生的新的类
public class UnsafeVarHandlerDemo {
public int value = 10;
public static void main(String[] args) throws NoSuchFieldException, IllegalAccessException {
UnsafeVarHandlerDemo demo = new UnsafeVarHandlerDemo();
Unsafe unsafe = getUnsafe();
long offset = unsafe.objectFieldOffset(UnsafeVarHandlerDemo.class.getDeclaredField("value"));
boolean b = unsafe.compareAndSwapInt(demo, offset, 10, 199);
System.out.println("value == " + demo.value);
}
private static Unsafe getUnsafe() throws NoSuchFieldException, IllegalAccessException {
// Unsafe unsafe = Unsafe.getUnsafe();
// System.out.println(unsafe);
Field field = Unsafe.class.getDeclaredField("theUnsafe");
field.setAccessible(true);
return (Unsafe) field.get(null);
}
private static void funcVarHandler() throws NoSuchFieldException, IllegalAccessException {
UnsafeVarHandlerDemo demo = new UnsafeVarHandlerDemo();
MethodHandles.Lookup lookup = MethodHandles.lookup();
VarHandle valueHandler = lookup.findVarHandle(UnsafeVarHandlerDemo.class, "value", int.class);
valueHandler.compareAndExchange(demo, 10, 12);
System.out.println(demo.value);
}
}
无锁底层实现
无锁底层实现使用的是 cmpxchg
指令实现,但实际上有可能不会直接使用它,如果可以他会先使用XADD
指令,
XADD
指令效率高于cmpxchg
x86汇编指令,表示交换加,即先将两个数交换,再将二者之和送给第一个数。
写法:XADD reg/mem, reg
作用:先将两个数交换,然将二者之和送给第一个数。
lock cmpxchg
lock compare and exchange
lock
主要功能是上锁,cmpxchg
主要功能是对比交换(cmpxchg
不是原子操作)
LOCK_IF_MP
表示如果是多核cpu需要加上lock