《深入理解Java内存模型》读书总结

摘要:
概要文章是《深入理解Java内容模型》读书笔记,该书总共包括了3部分的知识。实际上,JMM保证“如果程序正确同步,则执行结果与顺序一致性内存模型的结果相同”的机制;而这部分这是确保程序正确同步的机制。在java中,实例域、静态域和数组元素是线程之间共享的数据,它们存储在主内存中。它是Java线程之间通信的控制机制。第2部分同步机制1.volatile1.1作用如果一个变量是volatile类型,则对该变量的读写就将具有原子性。

概要

文章是《深入理解Java内容模型》读书笔记,该书总共包括了3部分的知识。

1部分,基本概念

包括“并发、同步、主内存、本地内存、重排序、内存屏障、happens before规则、as-if-serial规则、数据依赖性、顺序一致性模型、JMM的含义和意义”。

2部分,同步机制

该部分中就介绍了“同步”的3种方式:volatile、锁、final。对于每一种方式,从该方式的“特性”、“建立的happens before关系”、“对应的内存语义”、“实现方式”等几个方面进行了分析说明。实际上,JMM保证“如果程序正确同步,则执行结果与顺序一致性内存模型的结果相同”的机制;而这部分这是确保程序正确同步的机制。

3部分,JMM总结

第1部分 基本概念

1. 并发

定义:即,并发(同时)发生。操作系统中,是指一个时间段中有几个程序都处于已启动运行到运行完毕之间,且这几个程序都是在同一个处理机上运行,但任一个时刻点上只有一个程序在处理机上运行。

并发需要处理两个关键问题:线程之间如何通信线程之间如何同步。

(01) 通信—— 是指线程之间如何交换信息。在命令式编程中,线程之间的通信机制有两种:共享内存和消息传递。

(02) 同步—— 是指程序用于控制不同线程之间操作发生相对顺序的机制。在Java中,可以通过volatilesynchronized, 锁等方式实现同步。

2.主内存和本地内存

主内存 —— 即main memory。在java中,实例域、静态域和数组元素是线程之间共享的数据,它们存储在主内存中。

本地内存 —— 即local memory。 局部变量,方法定义参数 和 异常处理器参数是不会在线程之间共享的,它们存储在线程的本地内存中。

3.重排序

定义:重排序是指“编译器和处理器”为了提高性能,而在程序执行时会对程序进行的重排序。

说明:重排序分为——“编译器”和“处理器”两个方面,而“处理器”重排序又包括“指令级重排序”和“内存的重排序”。

关于重排序,我们需要理解它的思想:为了提高程序的并发度,从而提高性能!但是对于多线程程序,重排序可能会导致程序执行的结果不是我们需要的结果!因此,就需要我们通过“volatilesynchronize,锁等方式”作出正确的实现同步。

4.内存屏障

定义:包括LoadLoad, LoadStore, StoreLoad, StoreStore4种内存屏障。内存屏障是与相应的内存重排序相对应的。

屏障类型

指令示例

说明

LoadLoad Barriers

Load1; LoadLoad; Load2

确保Load1数据的装载,之前于Load2及所有后续装载指令的装载。

StoreStore Barriers

Store1; StoreStore; Store2

确保Store1数据对其他处理器可见(刷新到内存),之前于Store2及所有后续存储指令的存储。

LoadStore Barriers

Load1; LoadStore; Store2

确保Load1数据装载,之前于Store2及所有后续的存储指令刷新到内存。

StoreLoad Barriers

Store1; StoreLoad; Load2

确保Store1数据对其他处理器变得可见(指刷新到内存),之前于Load2及所有后续装载指令的装载。StoreLoad Barriers会使该屏障之前的所有内存访问指令(存储和装载指令)完成之后,才执行该屏障之后的内存访问指令。

作用:通过内存屏障可以禁止特定类型处理器的重排序,从而让程序按我们预想的流程去执行。

5. happens-before

定义JDK5(JSR-133)提供的概念,用于描述多线程操作之间的内存可见性。如果一个操作执行的结果需要对另一个操作可见,那么这两个操作之间必须存在happens-before关系。

作用:描述多线程操作之间的内存可见性。

[程序顺序规则]:一个线程中的每个操作,happens- before 于该线程中的任意后续操作。

[监视器锁规则]:对一个监视器锁的解锁,happens- before 于随后对这个监视器锁的加锁。

[volatile变量规则]:对一个volatile域的写,happens- before 于任意后续对这个volatile域的读。

[传递性]:如果A happens- before B,且B happens- before C,那么A happens- before C

6.数据依赖性

定义:如果两个操作访问同一个变量,且这两个操作中有一个为写操作,此时这两个操作之间就存在数据依赖性。

作用:编译器和处理器不会对“存在数据依赖关系的两个操作”执行重排序。

7.as-if-serial

定义:不管怎么重排序,程序的执行结果不能被改变。

8.顺序一致性内存模型

定义:它是理想化的内存模型。有以下规则:

(01) 一个线程中的所有操作必须按照程序的顺序来执行。

(02) 所有线程都只能看到一个单一的操作执行顺序。在顺序一致性内存模型中,每个操作都必须原子执行且立刻对所有线程可见。

9. JMM

定义Java Memory Mode,即Java内存模型。它是Java线程之间通信的控制机制

说明JMMJava程序作出保证——如果程序是正确同步的,程序的执行将具有顺序一致性。即,程序的执行结果与该程序在顺序一致性内存模型中的执行结果相同。

10.可见性

可见性一般用于指不同线程之间的数据是否可见。

java中, 实例域、静态域和数组元素这些数据是线程之间共享的数据,它们存储在主内存中;主内存中的所有数据对该内存中的线程都是可见的。而局部变量,方法定义参数 和 异常处理器参数这些数据是不会在线程之间共享的,它们存储在线程的本地内存中;它们对其它线程是不可见的。

此外,对于主内存中的数据,在本地内存中会对应的创建该数据的副本(相当于缓冲);这些副本对于其它线程也是不可见的。

11. 原子性

是指一个操作是按原子的方式执行的。要么该操作不被执行;要么以原子方式执行,即执行过程中不会被其它线程中断。

第2部分 同步机制

1.volatile

1.1作用

如果一个变量是volatile类型,则对该变量的读写就将具有原子性。如果是多个volatile操作或类似于volatile++这种复合操作,这些操作整体上不具有原子性。volatile变量自身具有下列特性:

[可见性]:对一个volatile变量的读,总是能看到(任意线程)对这个volatile变量最后的写入。

[原子性]:对任意单个volatile变量的读/写具有原子性,但类似于volatile++这种复合操作不具有原子性。

1.2 volatile的内存语义

volatile:当写一个volatile变量时,JMM会把该线程对应的本地内存中的共享变量刷新到主内存。

volatile:当读一个volatile变量时,JMM会把该线程对应的本地内存置为无效。线程接下来将从主内存中读取共享变量。

1.3 JMM中的实现方式

JMM针对编译器制定的volatile重排序规则表:

是否能重排序

第二个操作

第一个操作

普通读/

volatile

volatile

普通读/

NO

volatile

NO

NO

NO

volatile

NO

NO

下面是基于保守策略的JMM内存屏障插入策略:

在每个volatile写操作的前面插入一个StoreStore屏障。
在每个volatile写操作的后面插入一个StoreLoad屏障。
在每个volatile读操作的后面插入一个LoadLoad屏障。
在每个volatile读操作的后面插入一个LoadStore屏障。

1.4 volatilesynchronize对比

在功能上,监视器锁比volatile更强大;在可伸缩性和执行性能上,volatile更有优势。

volatile仅仅保证对单个volatile变量的读/写具有原子性;而synchronize锁的互斥执行的特性可以确保对整个临界区代码的执行具有原子性。

2.

2.1作用

锁是java并发编程中最重要的同步机制。

2.2锁的内存语义

(01) 线程A释放一个锁,实质上是线程A向接下来将要获取这个锁的某个线程发出了(线程A对共享变量所做修改的)消息。

(02) 线程B获取一个锁,实质上是线程B接收了之前某个线程发出的(在释放这个锁之前对共享变量所做修改的)消息。

(03) 线程A释放锁,随后线程B获取这个锁,这个过程实质上是线程A通过主内存向线程B发送消息。

2.3 JMM如何实现锁

公平锁

公平锁是通过“volatile”实现同步的。公平锁在释放锁的最后写volatile变量state;在获取锁时首先读这个volatile变量。根据volatilehappens-before规则,释放锁的线程在写volatile变量之前可见的共享变量,在获取锁的线程读取同一个volatile变量后将立即变的对获取锁的线程可见。

非公平锁

通过CAS实现的,CAS就是compare and swapCAS实际上调用的JNI函数,也就是CAS依赖于本地实现。以Intel来说,对于CASJNI实现函数,它保证:(01)禁止该CAS之前和之后的读和写指令重排序。(02)把写缓冲区中的所有数据刷新到内存中。

3.final

3.1特性

对于基本类型final域,编译器和处理器要遵守两个重排序规则:

(01) final写:“构造函数内对一个final域的写入”,与“随后把这个被构造对象的引用赋值给一个引用变量”,这两个操作之间不能重排序。

(02) final读:“初次读一个包含final域的对象的引用”,与“随后初次读对象的final域”,这两个操作之间不能重排序。

对于引用类型final域,除上面两条之外,还有一条规则:

(03) final写:在“构造函数内对一个final引用的对象的成员域的写入”,与“随后在构造函数外把这个被构造对象的引用赋值给一个引用变量”,这两个操作之间不能重排序。

注意:

final域的重排序规则可以确保:在引用变量为任意线程可见之前,该引用变量指向的对象的final域已经在构造函数中被正确初始化过了。其实要得到这个效果,还需要一个保证:在构造函数内部,不能让这个被构造对象的引用为其他线程可见,也就是对象引用不能在构造函数中“逸出”。

3.2 JMM如何实现final

通过“内存屏障”实现。

final域的写之后,构造函数return之前,插入一个StoreStore障屏。在读final域的操作前面插入一个LoadLoad屏障。

第3部分JMM总结

JMM保证:如果程序是正确同步的,程序的执行将具有顺序一致性 。

JMM设计

JMM设计者的角度来说,在设计JMM时,需要考虑两个关键因素:

(01) 程序员对内存模型的使用。程序员希望内存模型易于理解,易于编程。程序员希望基于一个强内存模型(程序尽可能的顺序执行)来编写代码。

(02) 编译器和处理器对内存模型的实现。编译器和处理器希望内存模型对它们的束缚越少越好,这样它们就可以做尽可能多的优化(对程序重排序,做尽可能多的并发)来提高性能。编译器和处理器希望实现一个弱内存模型。

JMM设计就需要在这两者之间作出协调。JMM对程序采取了不同的策略:

(01) 对于会改变程序执行结果的重排序,JMM要求编译器和处理器必须禁止这种重排序。

(02) 对于不会改变程序执行结果的重排序,JMM对编译器和处理器不作要求(JMM允许这种重排序)。


参考文献

1. 程晓明的“深入理解Java内存模型”的博客

http://www.infoq.com/cn/articles/java-memory-model-1

2. The JSR-133 Cookbook for Compiler Writers

http://gee.cs.oswego.edu/dl/jmm/cookbook.html

免责声明:文章转载自《《深入理解Java内存模型》读书总结》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇CodeForces-1178F1 Short Colorful Strip 区间DPNSBundle的使用,注意mainBundle和Custom Bundle的区别下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

.NET异步程序设计——异步委托

目录 1.AMP模式简介 2.使用BeginInvoke实现异步委托 3.原始线程怎么知道新线程已经运行完毕 4.使用AsyncCallback委托实现回调模式 5.源代码下载 shanzm-2020年2月11日 18:55:50 1.AMP模式简介 在.net1.x的版本中就可以使用IAsyncResult接口实现异步操作,但是比较复杂,这种...

Spring boot中最大连接数、最大线程数与最大等待数在生产中的异常场景

在上周三下午时,客户、业务和测试人员同时反溃生产环境登录进入不了系统,我亲自测试时,第一次登录进去了,待退出后再登录时,复现了客户的问题,场景像是请求连接被拒绝了,分析后判断是spring boot的连接数使用完了,于是重启了服务,客户访问都恢复正常。虽然问题暂时解决了,但实质原因还无法确定。根据分析,判断是spring boot服务连接被拒绝,查看配置的...

Go语言的调度模型(GPM)

GPM模型 定义于src/runtime/runtime2.go G: Gourtines(携带任务), 每个Goroutine对应一个G结构体,G保存Goroutine的运行堆栈,即并发任务状态。G并非执行体,每个G需要绑定到P才能被调度执行。 P: Processors(分配任务), 对G来说,P相当于CPU核,G只有绑定到P(在P的local ru...

操作系统复习知识

一、进程和线程 进程和线程的区别: 进程是一个正在执行中的程序,包括程序计数器、寄存器和变量的当前值;一个进程包含一个或多个线程。 进程是操作系统分配资源的最小单位;而线程是作为独立运行和CPU调度的基本单位。 进程间的资源是独立的,而同一进程的各线程间资源是共享的;进程有自己的独立地址空间,每启动一个进程,系统就会为它分配地址空间、建立数据表来维护...

switch_to函数为什么要保存esi/edi/ebx/ebp?

线程切换过程:   interrupt_handler.S(interrupt_handle_entry)  ->  interrupt.c(c_version_handle)  ->  switch_to.S 结论:   在switch_to函数中必须保存esi/edi/edx/ebp这四个寄存器 原因:   GCC在对C、汇编代码进行混合编...

QT多线程及通过事件进行通信(通过自定义事件,然后QApplication::postEvent给主界面,我之前用的是信号槽)

可以通过QThread实现跨平台的多线程开发,Qt库负责在特定平台上的特定多线程实现。要采用QThread进行多线程开发,首先需要包含头文件: #include <QThread> 然后需要从QThread继承一个自己的线程类,暂作MyThread,关键是要实现QThread内的一个虚函数run。在run函数内部,最后一般都调用exec(),使...