发布时间:2023-09-03 16:00
这套Github上40K+star学习笔记,可以帮你搞定95%以上的Java面试
毫不夸张的说,这份SpringBoot学习指南能解决你遇到的98%的问题
给跪了!这套万人期待的 SQL 成神之路PDF,终于开源了
一个操作或者多次操作,要么所有的操作全部都得到执行并且不会受到任何因素的干扰而中断,要么所有的操作都执行,要么都不执行。
对于基本数据类型的访问,读写都是原子性的【long和double可能例外】。
如果需要更大范围的原子性保证,可以使用synchronized关键字满足。
当一个变量对共享变量进行了修改,另外的线程都能立即看到修改后的最新值。
volatile
保证共享变量可见性,除此之外,synchronized
和final
都可以 实现可见性。
synchronized
:对一个变量执行unclock之前,必须先把此变量同步回主内存中。
final
:被final修饰的字段在构造器中一旦被初始化完成,并且构造器没有把this的引用传递出去,其他线程中就能够看见final字段的值。
即程序执行的顺序按照代码的先后顺序执行【由于指令重排序的存在,Java 在编译器以及运行期间对输入代码进行优化,代码的执行顺序未必就是编写代码时候的顺序】,volatile
通过禁止指令重排序保证有序性,除此之外,synchronized
关键字也可以保证有序性,由【一个变量在同一时刻只允许一条线程对其进行lock操作】这条规则获得。
计算机在执行程序时,每条指令都是在CPU中执行的,而执行指令过程中,势必涉及到数据的读取和写入。由于程序运行过程中的**临时数据是存放在主存(物理内存)**当中的,这时就存在一个问题,由于CPU执行速度很快,而从内存读取数据和向内存写入数据的过程跟CPU执行指令的速度比起来要慢的多,因此如果任何时候对数据的操作都要通过和内存的交互来进行,会大大降低指令执行的速度。
为了解决CPU处理速度和内存不匹配的问题,CPU Cache出现了。
图源:JavaGuide
当程序在运行过程中,会将运算需要的数据从主存复制一份到CPU的高速缓存当中,那么CPU进行计算时就可以直接从它的高速缓存读取数据和向其中写入数据,当运算结束之后,再将高速缓存中的数据刷新到主存当中。
在单线程中运行是没有任何问题的,但是在多线程环境下问题就会显现。举个简单的例子,如下面这段代码:
i = i + 1;
按照上面分析,主要分为如下几步:
多线程环境下,可能出现什么现象呢?
最终的结果i = 1而不是i = 2,得出结论:如果一个变量在多个CPU中都存在缓存(一般在多线程编程时才会出现),那么就可能存在缓存不一致的问题。
解决缓存不一致的问题,通常来说有如下两种解决方案【都是在硬件层面上提供的方式】:
通过在总线加LOCK#锁的方式
在早期的CPU当中,是通过在总线上加LOCK#锁的形式来解决缓存不一致的问题。因为CPU和其他部件进行通信都是通过总线来进行的,如果对总线加LOCK#锁的话,也就是说阻塞了其他CPU对其他部件访问(如内存),从而使得只能有一个CPU能使用这个变量的内存。比如上面例子中 如果一个线程在执行 i = i +1,如果在执行这段代码的过程中,在总线上发出了LCOK#锁的信号,那么只有等待这段代码完全执行完毕之后,其他CPU才能从变量i所在的内存读取变量,然后进行相应的操作。这样就解决了缓存不一致的问题。
但,有一个问题,在锁住总线期间,其他CPU无法访问内存,导致效率低下,于是就出现了下面的缓存一致性协议。
通过缓存一致性协议
较著名的就是Intel的MESI协议,MESI协议保S证了每个缓存中使用的共享变量的副本是一致的。
当CPU写数据时,如果发现操作的变量是共享变量,即在其他CPU中也存在该变量的副本,会发出信号通知其他CPU将该变量的缓存行置为无效状态,因此当其他CPU需要读取这个变量时,发现自己缓存中缓存该变量的缓存行是无效的【嗅探机制:每个处理器通过嗅探在总线上传播的数据来检查自己的缓存的值是否过期】,那么它就会从内存重新读取。
基于MESI一致性协议,每个处理器需要不断从主内存嗅探和CAS不断循环,无效交互会导致总线带宽达到峰值,出现总线风暴。
JMM【Java Memory Model】
:Java内存模型,是java虚拟机规范中所定义的一种内存模型,Java内存模型是标准化的,屏蔽掉了底层不同计算机的区别,以实现让Java程序在各种平台下都能达到一致的内存访问效果。
它描述了Java程序中各种变量【线程共享变量】的访问规则,以及在JVM中将变量存储到内存和从内存中读取变量这样的底层细节。
注意,为了获得较好的执行性能,Java内存模型并没有限制执行引擎使用处理器的寄存器或者高速缓存来提升指令执行速度,也没有限制编译器对指令进行重排序。也就是说,在java内存模型中,也会存在缓存一致性问题和指令重排序的问题。
所有的共享变量都存储于主内存,这里所说的变量指的是【实例变量和类变量】,不包含局部变量,因为局部变量是线程私有的,因此不存在竞争问题。
每个线程都有自己的工作内存(类似于前面的高速缓存)。线程对变量的所有操作都必须在工作内存中进行,而不能直接对主存进行操作。
每个线程不能访问其他线程的工作内存。
在Java中,对基本数据类型的变量的读取和赋值操作是原子性操作,即这些操作是不可被中断的,要么执行,要么不执行。
为了更好地理解上面这句话,可以看看下面这四个例子:
x = 10; //1
y = x; //2
x ++; //3
x = x + 1; //4
需要注意的点:
Java提供了volatile关键字来保证可见性。
当一个共享变量被volatile修饰时,它会保证修改的值会立即被更新到主存,当有其他线程需要读取时,它会去内存中读取新值。
另外,通过synchronized和Lock也能够保证可见性,synchronized和Lock能保证同一时刻只有一个线程获取锁然后执行同步代码,并且在释放锁之前会将对变量的修改刷新到主存当中。因此可以保证可见性。
在Java内存模型中,允许编译器和处理器对指令进行重排序,但是重排序过程不会影响到单线程程序的执行,却会影响到多线程并发执行的正确性。
在Java里面,可以通过volatile关键字来保证有序性,另外也可以通过synchronized和Lock来保证有序性。
Java内存模型具备一些先天的有序性,前提是两个操作满足happens-before原则,摘自《深入理解Java虚拟机》:
如果两个操作的执行次序无法从happens-before原则推导出来,那么它们就不能保证它们的有序性,虚拟机可以随意地对它们进行重排序。
保证了不同线程对共享变量【类的成员变量,类的静态成员变量】进行操作是时的可见性,一个线程修改了某个变量的值,新值对其他线程来说是立即可见的。
禁止指令重排序。
举个简单的例子,看下面这段代码:
//线程1
boolean volatile stop = false;
while(!stop){
doSomething();
}
//线程2
stop = true;
volatile无法保证原子性,如对一个volatile修饰的变量进行自增操作i ++
,无法保证多线程下结果的正确性。
解决方法:
下面这段话摘自《深入理解Java虚拟机》:
观察加入volatile关键字和没有加入volatile关键字时所生成的汇编代码发现,加入volatile关键字时,会多出一个lock前缀指令。
lock前缀指令实际上相当于一个内存屏障(也成内存栅栏),内存屏障会提供3个功能:
- 它确保指令重排序时不会把其后面的指令排到内存屏障之前的位置,也不会把前面的指令排到内存屏障的后面;即在执行到内存屏障这句指令时,在它前面的操作已经全部完成;
- 它会强制将对缓存的修改操作立即写入主存;
- 如果是写操作,它会导致其他CPU中对应的缓存行无效。
volatile变量读操作的性能消耗与普通变量几乎没有什么差别,但是写操作则会慢一些,因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。不过即便如此,大多数场景下volatile的总开销仍然要比锁来的低。
使用volatile必须具备两个条件【保证原子】:
用双重检查锁的方式实现单例模式:
public class Singleton {
//注意使用volatile防止指令重排序
private volatile static Singleton instance;
//私有化构造方法,单例模式基本操作
private Singleton() {
}
//静态获取单例的方法
public static Singleton getInstance() {
//先判断对象是否已经实例过,没有实例化过才进入加锁代码
if (instance == null) {
//类对象加锁
synchronized (Singleton.class) {
if (instance == null) {
instance = new Singleton();
}
}
}
return instance;
}
}
使用volatile
的原因:防止指令重排序。
instance= new Singleton();
这一步,是一个实例化的过程,底层其实分为三部执行:
- 为instance分配内存空间:
memory = allocate();
- 实例化instance。
ctorInstance(memory);
- 将instance指向分配的内存地址。
instance = memory;
由于JVM具有指令重排序的特性,指令的执行顺序可能会变成1,3,2。在多线程环境下,可能某个线程可能会得到未初始化的实例。
举个例子:加入线程A执行了1和2之后,线程B调用getInstance的时候,会发现instance不为null,会直接返回这个没有执行过指令3的实例。