• 并发高?可能是编译优化引发有序性问题


    摘要:CPU为了对程序进行优化,会对程序的指令进行重排序,此时程序的执行顺序和代码的编写顺序不一定一致,这就可能会引起有序性问题。

    本文分享自华为云社区《【高并发】解密导致并发问题的第三个幕后黑手——有序性问题》,作者:冰 河 。

    有序性

    有序性是指:按照代码的既定顺序执行。

    说的通俗一点,就是代码会按照指定的顺序执行,例如,按照程序编写的顺序执行,先执行第一行代码,再执行第二行代码,然后是第三行代码,以此类推。如下图所示。

    指令重排序

    编译器或者解释器为了优化程序的执行性能,有时会改变程序的执行顺序。但是,编译器或者解释器对程序的执行顺序进行修改,可能会导致意想不到的问题!

    在单线程下,指令重排序可以保证最终执行的结果与程序顺序执行的结果一致,但是在多线程下就会存在问题。

    如果发生了指令重排序,则程序可能先执行第一行代码,再执行第三行代码,然后执行第二行代码,如下所示。

    例如下面的三行代码。

    int x = 1; 
    int y = 2;
    int z = x + y;

    CPU发生指令重排序时,能够保证x=1和y = 2这两行代码在z = x + y这行代码的上面,而x = 1和 y = 2的顺序就不一定了。在单线程下不会出现问题,但是在多线程下就不一定了。

    有序性问题

    CPU为了对程序进行优化,会对程序的指令进行重排序,此时程序的执行顺序和代码的编写顺序不一定一致,这就可能会引起有序性问题。

    在Java程序中,一个经典的案例就是使用双重检查机制来创建单例对象。例如,在下面的代码中,在getInstance()方法中获取对象实例时,首先判断instance对象是否为空,如果为空,则锁定当前类的class对象,并再次检查instance是否为空,如果instance对象仍然为空,则为instance对象创建一个实例。

    package io.binghe.concurrent.lab01;
    
    /**
     * @author binghe
     * @version 1.0.0
     * @description 测试单例
     */
    public class SingleInstance {
    
        private static SingleInstance instance;
    
        public static SingleInstance getInstance(){
            if(instance == null){
                synchronized (SingleInstance.class){
                    if(instance == null){
                        instance = new SingleInstance();
                    }
                }
            }
            return instance;
        }
    }

    如果编译器或者解释器不会对上面的程序进行优化,整个代码的执行过程如下所示。

    注意:为了让大家更加明确流程图的执行顺序,我在上图中标注了数字,以明确线程A和线程B执行的顺序。

    假设此时有线程A和线程B两个线程同时调用getInstance()方法来获取对象实例,两个线程会同时发现instance对象为空,此时会同时对SingleInstance.class加锁,而JVM会保证只有一个线程获取到锁,这里我们假设是线程A获取到锁。则线程B由于未获取到锁而进行等待。接下来,线程A再次判断instance对象为空,从而创建instance对象的实例,最后释放锁。此时,线程B被唤醒,线程B再次尝试获取锁,获取锁成功后,线程B检查此时的instance对象已经不再为空,线程B不再创建instance对象。

    上面的一切看起来很完美,但是这一切的前提是编译器或者解释器没有对程序进行优化,也就是说CPU没有对程序进行重排序。而实际上,这一切都只是我们自己觉得是这样的。

    在真正高并发环境下运行上面的代码获取instance对象时,创建对象的new操作会因为编译器或者解释器对程序的优化而出现问题。也就是说,问题的根源在于如下一行代码。

    instance = new SingleInstance();

    对于上面的一行代码来说,会有3个CPU指令与其对应。

    1.分配内存空间。

    2.初始化对象。

    3.将instance引用指向内存空间。

    正常执行的CPU指令顺序为1—>2—>3,CPU对程序进行重排序后的执行顺序可能为1—>3—>2。此时,就会出现问题。

    当CPU对程序进行重排序后的执行顺序为1—>3—>2时,我们将线程A和线程B调用getInstance()方法获取对象实例的两种步骤总结如下所示。

    【第一种步骤】

    (1)假设线程A和线程B同时进入第一个if条件判断。

    (2)假设线程A首先获取到synchronized锁,进入synchronized代码块,此时因为instance对象为null,所以,此时执行instance = new SingleInstance()语句。

    (3)在执行instance = new SingleInstance()语句时,线程A会在JVM中开辟一块空白的内存空间。

    (4)线程A将instance引用指向空白的内存空间,在没有进行对象初始化的时候,发生了线程切换,线程A释放synchronized锁,CPU切换到线程B上。

    (5)线程B进入synchronized代码块,读取到线程A返回的instance对象,此时这个instance不为null,但是并未进行对象的初始化操作,是一个空对象。此时,线程B如果使用instance,就可能出现问题!!!

    【第二种步骤】

    (1)线程A先进入if条件判断,

    (2)线程A获取synchronized锁,并进行第二次if条件判断,此时的instance为null,执行instance = new SingleInstance()语句。

    (3)线程A在JVM中开辟一块空白的内存空间。

    (4)线程A将instance引用指向空白的内存空间,在没有进行对象初始化的时候,发生了线程切换,CPU切换到线程B上。

    (5)线程B进行第一次if判断,发现instance对象不为null,但是此时的instance对象并未进行初始化操作,是一个空对象。如果线程B直接使用这个instance对象,就可能出现问题!!!

    在第二种步骤中,即使发生线程切换时,线程A没有释放锁,则线程B进行第一次if判断时,发现instance已经不为null,直接返回instance,而无需尝试获取synchronized锁。

    我们可以将上述过程简化成下图所示。

    总结

    导致并发编程产生各种诡异问题的根源有三个:缓存导致的可见性问题、线程切换导致的原子性问题和编译优化带来的有序性问题。我们从根源上理解了这三个问题产生的原因,能够帮助我们更好的编写高并发程序。

     

    点击关注,第一时间了解华为云新鲜技术~

  • 相关阅读:
    多线程案例
    Fault-Tolerance, Fast and Slow: Exploiting Failure Asynchrony in Distributed Systems
    LRU缓存实现案例
    kubernetes:基于ab的压力测试
    《软件测试52讲》——测试数据准备篇
    《软件测试52讲》——性能测试篇
    《软件测试52讲》——代码测试篇
    《软件测试52讲》——API自动化测试篇
    《软件测试52讲》——GUI自动化测试篇
    《梁宁产品思维30讲》——创新模式:找到创新模式,发现新大陆
  • 原文地址:https://www.cnblogs.com/huaweiyun/p/15587518.html
Copyright © 2020-2023  润新知