分享下本人在盘ConcurrentHashMap底层源码之前做的技术点预先准备,以及要点方法的学习方式。由于本人之前技术能力也是有限,所以不论之前是有了解过还是未了解的同学都是可以阅读。 当然小菜鸟在阅读学习过程中,有些知识点理解有误,也请各位大佬多多指出。
由于在ConcurrentHashMap底层源码过程中,采用大量的位运算代替乘,取余等计算[位运算效率高],那么位运算是基于计算机可识别的二进制的基础上计算,此版块必须得理解;
二进制基础【整数 32位。十进制转二进制 不足32位的,最高位补符号位,其余补零】:
正数15转二进制的例子:
15 | … | 256[2^8] | 128[2^7] | 64[2^6] | 32[2^5] | 16[2^4] | 8[2^3] | 4[2^2] | 2[2^1] | 1[2^0] |
---|---|---|---|---|---|---|---|---|---|---|
原码 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |
反码 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |
补码 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |
15 = 2^0 + 2^1 + 2^2 + 2^3。 不满32补0,最高位0是代表正数,因此完整的原-反-补码:
00000000 00000000 00000000 00001111
负数-15转二进制例子:
原码:10000000 00000000 00000000 00001111(转二进制,最高位为符号位)
反码:11111111 11111111 11111111 11110000(符号位不变,其余取反)
补码:11111111 11111111 11111111 11110001(反码+1)
在了解二进制的转换后,那么在Java环境中,均是使用补码进行运算;
以下例子用于说明【使用8位方便标识】:
int a = 3;
原码:0000 0011
反码:0000 0011
补码:0000 0011
int b = 5;
原码:0000 0101
反码:0000 0101
补码:0000 0101
1. &与运算[同时为1,则为1,反则0 ]:
3&5 = 1
3补码:0000 0011
5补码:0000 0101
结 果:0000 0001
2. |或运算[只要有1位为1,则为1,反则0]:
3|5 = 7
3补码:0000 0011
5补码:0000 0101
结 果:0000 0111
3. ~非运算[将操作数的每个位(包括符号位)全部取反]
~3 = -248
3补码:0000 0011
结 果:1111 1000
4.^异或运算[俩位相同时,则为0,反则1]
3^5 = 6
3补码:0000 0011
5补码:0000 0101
结 果:0000 0110
5.<<左移运算[将反码整体左移n位,右边空出补0]
3<<1 = 6
3补码:0000 0011 ->左移2位 :000 00110 ->结果:0000 0110
6.>>右移运算[将反码整体右移n位,左边空出,则以符号位为准(正数补0,负数补1)]
3>>1 = 1
3补码 :0000 0011 ->右移1位:00000 001 -> 结果:0000 0001
7.>>>无符号右移运算[将反码整体右移n位,左边空出全部补0]
-3>>>1 = 246
-3补码:1111 1101 ->右移1位:01111 110 -> 结果:0111 1110
悲观锁: 一个线程占有了一个资源,而导致其他线程进行等待或者执行其他没有加锁代码块,一直到该锁释放,在由下一个线程占有,性能低。 俗称独占锁,synchronized就是典型悲观锁
乐观锁:每个线程都可以访问,没有加锁,抱着尝试的态度,去执行某个操作,一旦操作冲突或者操作失败,则重试,直到成功为止;
每一个线程中,都会有属于自己的工作内存保存了该线程使用的变量在主内存副本copy。 并且各个线程不能访问对方的工作内存,所有线程均是对变量的操作必须在工作内存进行,so线程之间的变量传递只能通过主内存。
主内存与工作内存之间的又是怎么交互:即一个变量如何从主内存拷贝到工作内存? 如何从工作内存同步到主内存中的实现细节?
Java内存模型定义了8种原子操作:
Java内存模型还规定了执行上述8种原子操作时必须满足如下规则:
在了解了上述的Java内存模型,在来看看并发开发中主要围绕三个性质:
原子性:与事务一样样儿的含义。 N个操作要么一起执行,要么一起不执行或者失败;
有序性:在Java的执行过程中,代码执行的保证一定得顺序执行。 那反则无关联的代码,为了性能,可能会和代码块的顺序有出入,例如int i=1, int j=2 ,int m=3, 可能会先int m=3-》int i=1-》 int j=2 这种被称为指令重排
可见性:指当一个线程修改了这个变量的值,新值(修改后的值)对于其他线程来说是立即可以得知的; 在变量被修改过,直接忽略改线程工作内存,直接同步到主内存中; 其他线程在读取时,也是直接去主线程中获取; 普通变量需要经过线程的工作内存
被volatile关键字修饰的变量,是具备可见性以及放置指令重排;
它是如何做到线程安全呢?
首先思考一个问题:为什么会产生线程不安全?看下方代码
void sum(int a){
i = i+a;
}
在并发情况下,i属于普通变量,现在有A和B俩个线程并发操作这个函数,那么A先从主内存获取i变量—>刷新到A线程工作内存中---->进行i+a操作,在此操作过程中,B线程也要执行此函数,那此时A线程还是处理中,主内存的值还是原先i的,此时B线程获取依旧是原来的i【注意此时A线程已经对i做了操作,只是还没完成而已】---->刷新到B工作内存中---->此时A线程已经完成了函数并将i存入A工作内存----->JMM将A工作内存i副本刷新到主内存【在注意此刻B可是已经把原来老的i取走在用呀】---->这时B线程也完成了函数----->刷新B工作内存并同步主内存了【看出问题了吧】。
本身i+a被A和B线程个执行了一次,正常情况来说B晚于A执行,那么B的i+a中的i应该是A线程计算出来结果,所以出现线程不安全。 那么怎么去解决这个问题? Java给我们提供两种大类型的方式:1、A在执行的时候,B线程等到A执行完成后,B在执行【其实走的悲观锁的思路,现在不做过多介绍】。
2、AB俩个线程你俩可以并行执行,但是变量不能都经过线程工作内存呀,而且得本地保留个副本,不论是哪个线程改了后,得立马让其他线程知道, 那么每个线程在做最后一不commit时,就得用本地的副本与主内存进行比较,相同的话,那么在调整主内存的值,否者不给调整;
http://www.cnblogs.com/stateis0/
为了方便大家理解,说了这么多大白话,下面开始介绍CAS:
CAS (compareAndSwap),中文叫比较交换,一种无锁原子算法。过程是这样:它包含 3 个参数 CAS(V,E,N),V表示要更新变量的值,E表示预期值,N表示新值。仅当 V值等于E值时,才会将V的值设为N,如果V值和E值不同,则说明已经有其他线程做两个更新,则当前线程则什么都不做。最后,CAS 返回当前V的真实值。CAS 操作时抱着乐观的态度进行的,它总是认为自己可以成功完成操作。
当多个线程同时使用CAS 操作一个变量时,只有一个会胜出,并成功更新,其余均会失败。失败的线程不会挂起,仅是被告知失败,并且允许再次尝试,当然也允许实现的线程放弃操作。基于这样的原理,CAS 操作即使没有锁,也可以发现其他线程对当前线程的干扰。
与锁相比,使用CAS会使程序看起来更加复杂一些,但由于其非阻塞的,它对死锁问题天生免疫,并且,线程间的相互影响也非常小。更为重要的是,使用无锁的方式完全没有锁竞争带来的系统开销,也没有线程间频繁调度带来的开销,因此,他要比基于锁的方式拥有更优越的性能。
简单的说,CAS 需要你额外给出一个期望值,也就是你认为这个变量现在应该是什么样子的。如果变量不是你想象的那样,哪说明它已经被别人修改过了。你就需要重新读取,再次尝试修改就好了。
CAS 的缺点:
CAS 看起来非常的牛皮,但是他仍然有缺点,最著名的就是 ABA 问题,假设一个变量 A ,修改为 B之后又修改为 A,CAS 的机制是无法察觉的,但实际上已经被修改过了。如果在基本类型上是没有问题的,但是如果是引用类型呢?这个对象中有多个变量,我怎么知道有没有被改过?聪明的你一定想到了,加个版本号啊。每次修改就检查版本号,如果版本号变了,说明改过,就算你还是 A,也不行。