Java内存模型(Java Memory Model,JMM),Java虚拟机规范中定义的来屏蔽掉各种硬件和操作系统的内存访问差异,
以实现让Java程序在各种平台下都能达到一致的内存访问结果。
happens-before
JMM中最为重要的一个概念便是 happens-before 关系。
happens-before 关系是用来描述两个操作的内存可见性的。如果操作 X happens-before 操作 Y,那么 X 的结果对于 Y可见。
另外与程序员密切相关的happens-before规则如下:
1)、程序执行顺序:一个线程中的每个操作,happens-before于该线程中的任意后续操作
2)、监视器锁规则:对于一个锁的解锁,happens-before于随后对这个锁的加锁
3)、volatile变量规则:对一个volatile域的写,happens-before于任意后续对这个volatile域的读
4)、传递性:如果A happens-before B,且B happens-before C,那么A happens-before C。
1、主内存与工作内存
Java内存模型的主要目标是定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存中和从内存中取出变量这样的
底层细节。此处的变量与Java编程中所说的变量不同,它包含了实例字段、静态字段和构成数组对象的元素,但不包含局部
变量与方法参数,因为后者是线程私有的,不会被共享,自然不存在竞争问题。
主内存(Main Memory)虚拟机内存的一部分,所有的变量都存储在主内存中,线程共享区域 (堆中对象实例数据部分)
工作内存(Working Memory):每个线程私有的内存区域,保存了该线程使用到的变量的主内存副本拷贝,线程对变量的 (虚拟机栈的部分区域)
所有操作(读取、赋值)等都必须在工作内存中进行,而不能直接读写主内存中的变量。不同线程之间也无法访问对方
工作内存中的变量,线程间变量值的传递均需要通过主内存来完成。
如此可见,线程之间的通信也是通过共享主内存来实现的,需要经历下面两个步骤:
1):线程A把本地内存A中更新过的共享变量刷新到主内存中去
2):线程B到主内存中去读取线程A之前已经更新过的共享变量
2、内存间交互操作
主内存和工作内存之间具体的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节
,JMM定义了8中操作来完成,虚拟机实现时必须保证下面的每一种操作都是原子的、不可再分的
lock(锁定):作用与主内存的变量,它把一个变量标识为一个线程独占的状态
unlock(解锁):作用与主内存的变量,它把一个出于锁定状态的变量释放出来,释放后才能被其他线程锁定
read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用
load(载入):作用与工作内存的变量,它把read操作从主内存中得到的变量放入工作内存的变量副本中
use(使用):作用与工作内存的变量,它把工作内存中的一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量的值的字节码指定时就会执行这个操作
assign(赋值):作用于工作内存的变量,它把一个执行引擎接收到的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作
store(存储):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用
write(写入):作用于主内存的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。
如果要把一个变量从主内存复制到工作内存,那就要顺序地执行read和load操作,如果要把工作内存中的变量值同步回主内存,就要顺序地执行store和write操作。
Java内存模型要求read和load,store和write必须顺序执行,可以不必连续执行。另外Java内存模型还规定了在执行上面8种操作必须满足下面的规则
1、不允许read和load,store和write操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者从工作内存发起了回写但是主内存不接受的情况出现
2、不允许一个线程丢弃它的最近的assign操作,即变量在工作内存中改变了后必须把该变化同步回主内存 (修改了必须回写)
3、不允许一个线程无原因地(没有发生assign操作)把数据从工作内存同步到主内存中 (没有修改不允许回写)
4、一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,换句话说,就是对一个变量实施use、store之前
必须load和assign
5、一个变量同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量
才能被解锁(可重入)
6、如果对一个变量执行lock操作,那将会清空工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行load和assign操作初始化变量的值
7、如果一个变量事先没有被lock操作锁定,那就不允许对它执行unlock操作,也不允许去unlock一个被其他线程锁定住的变量
8、对一个变量执行unlock操作之前,必须先把此变量同步回主内存中(执行store、write操作)
这8种内存访问操作以及上述规则限定,再加上volatile的一些特殊规定,就完全确定了Java程序中哪些内存访问操作在并发下是安全的。
volatile(读音:vo la tile)
关键字volatile可以说是Java虚拟机提供的最轻量级的同步机制。
当一个变量被定义为volatile之后,它将具备两种特性,第一是保证此变量对所有线程的可见性,可见性是指,当一个线程修改了这个变量的值,新值对于其他线程
来说是可以立即得知的。而普通变量不能做到这一点,普通变量的值在线程间传递均需要通过主内存来完成(线程主动去主内存读取操作才能得知)
对volatile变量的所有写操作都能立刻反应到其他线程之中,volatile的这一特性可以认为volatile变量在各个线程中是一致的。
但是,基于volatile变量的运算在并发下并不是线程安全的,这是因为Java里面的运算并非原子操作的。如:a++,线程A在对a执行加一操作前可能其他线程的操作
将较小的a值同步回主内存之中。
由于volatile变量只能保证可见性,在不符合以下两条规则的运算场景中,仍然需要加锁(使用synchronized或者java.util.concurrent包下的原子类)来保证原子性
1、运算结果并不依赖变量的当前值,或者能够确保只有单一的线程修改变量的值
2、变量不需要与其他的状态变量共同参与不变约束
volatile写-读的内存语义
volatile写的内存语义:当写一个volatile变量时,JMM会把该线程对应的本地内存中的共享变量值刷新到主内存中。
volatile读的内存语义:当读一个volatile时,JMM会把该线程对应的本地内存置为无效。线程接下来会到主内存中读取共享变量。
volatile内存语义的实现
JMM通过限制编译器重排序和处理器重排序来实现volatile的内存语义。编译器在生成字节码时,会在指令序列中插入内存屏障来禁止特定类型的处理器重排序。限制规则:
1)当一组指令第二个操作是volatile写时,不能重排序
2)当第一个操作是volatile读时,不能重排序
3)当第一个操作是volatile写,第二个操作是volatile读时,不能重排序
锁的内存语义
1、锁的释放-获取建立的happens-before关系
锁是Java并发编程中最重要的同步机制。锁除了让临界区互斥执行外,还可以让释放锁的线程向获取同一个锁的线程发送消息。
2、锁的释放和获取的内存语义
当线程释放锁时,JMM会把该线程对应的本地内存中的共享变量刷新到主内存中去。
当线程获取锁时,JMM会把该线程对应的本地内存置为无效。从而使被监视器保护的临界区代码必须从主内存中读取共享变量(防止在阻塞等待期间其本地的共享变量拷贝过时)。
对比锁释放-获取内存的内存语义与volatile写-读的内存语义可以看出:锁释放与volatile写有相同的内存语义;锁获取与volatile读有相同的内存语义。
总结:
1)、线程A释放一个锁,实质上是线程A向接下来将要获取这个锁的某个线程(线程A对共享变量所做修改的)消息
2)、线程B获取一个锁,实质上是线程B接收了之前某个线程发出的(在释放这个锁之前对共享变量所做修改的)消息
3)、线程A释放锁,线程B获取这个锁,这个过程实质上是线程A通过主内存向线程B发送消息
3、锁内存语义的实现
ReentrantLock:lock()方法获取锁,unlock()方法释放锁
ReentrantLock的实现依赖于Java同步框架AbstractQueuedSynchronizer(AQS)。AQS使用一个整形的volatile变量state来维护同步状态,state是
ReentrantLock内存语义实现的关键。
如公平锁在释放锁的最后写volatile变量state,在获取这个锁的时候先读这个volatile变量。根据happens-before规则,释放锁的线程写完可见的volatile
变量之后,获取锁的线程读取同一个volatile变量后将立即变得对获取锁的线程可见。
4、concurrent包的实现
Java的CAS能够获取变量的最新值和修改共享变量的值,因此其同时具有volatile读和volatile写的内存语义。
Java的CAS使用处理器提供的原子指令以原子方式对内存执行【读-改-写】操作,这是在多处理器中实现同步的关键。同时,volatile变量的读/写和CAS
可以实现线程之间的通信。这些特征整合在一起,就形成了整个concurrent包得以实现的基石。
concurrent包的源代码实现有一个通用化的实现模式:
首先:声明共享变量为volatile
然后:使用CAS的原子条件更新来实现线程之间的同步
同时,配合以volatile的读/写和CAS所具有的volatile读和写的内存语义来实现线程之间的通信。