• Java并发专题(二)线程安全


    前言

      随着时代的发展,CPU核数的增加和计算速度的提升,串行化的任务执行显然是对资源的极大浪费,掌握多线程是每个程序员必须掌握的技巧。但是同时多线程也是一把双刃剑,带来了共享资源安全的隐患。在本节会介绍线程安全是什么、最基本的独占悲观式来保证线程安全的介绍。随着章节步步深入。

    1.1 什么是线程安全?

    1.1.1 初识线程安全的尴尬

      本人是17年毕业的,刚进第一家公司的时候没有开发经验,对接第三方支付公司外部API压测的时候碰到一个问题:对方要求我5次/s,一共发300s的付款请求。其中一个请求的id,保证当日每一次唯一。我请求的id从1开始递增,但是总是也达不到300*5=1500。也闹出了很尴尬的笑话。这是我第一次接触多线程。为了简化问题,例子如下:2个线程对一个数字递增加2000次,看看是否最后是2000。

    /**
     * 多线程递增某一个数字的测试类。
     *
     * @author GrimMjx
     */
    public class UnsafeAdd {
    
        private int i;
    
        public int getNext() {
            return i++;
        }
    
        public static void main(String[] args) throws InterruptedException {
            UnsafeAdd multiAdd = new UnsafeAdd();
    
            Thread thread1 = new Thread(() -> {
                for (int i = 0; i < 1000; i++) {
                    multiAdd.getNext();
                }
            });
    
            Thread thread2 = new Thread(() -> {
                for (int i = 0; i < 1000; i++) {
                    multiAdd.getNext();
                }
            });
    
            thread1.start();
            thread2.start();
    
            //请结合上一章节体会为何写下面2行
            thread1.join();
            thread2.join();
    
            System.out.println(multiAdd.i);
        }
    }

      运行的结果99%都不是自己想要的结果,说明这边出现了线程安全的问题。除了这个例子相信很多同学都会听到类似这种话"HashMap不是线程安全的"、"不可变对象一定是线程安全的"等等。这些都是在说线程安全方面的话题,之后的源码分析专题会分析为什么HashMap不是线程安全的,取而代之的ConcurrentHashMap如何保证线程安全的?同时JDK6引入ConsurrentSkipListMap和ConcurrentSkipListSet分别作为同步的SortedMap和SortedSet的并发替代品,还有用synchronizedxxx()方法包装的Map。

    1.1.2 线程安全的概念

      对于线程安全的概念,参考《Java Concurrency in Practice》中的一句对线程安全的定义:当多个线程访问某个类时,这个类始终都能表现出正确的行为,那么这个类就是线程安全的。

    1.1.3 Race condition(竞态条件)

      现在我们来分析一下上面的数据不一致问题,这种情况成为竞态条件,为什么会出现这个问题?UnsafeAdd的问题在于,线程的执行是由CPU时间片轮询调度的,如果执行的时机不对,那么可能在调用getNext()方法的时候得到一样的值、或者某些值被忽略等。主要是i++;看起来是一个原子操作,但是它包含了3个独立的操作:读取i,将i+1,并将计算结果写入i。简单画一张图,如下:

      

      线程A和线程B可能都读到i的变量为10,所以可能导致重复的情况,造成达不到2000的效果。

    1.2 初识保证线程安全的基本方法

    1.2.1 synchronized关键字

      什么是synchronized?引入一段来自JDK官网对synchronized关键字比较权威的解释:Synchronized keyword enable a simple strategy for preventing thread interference and memory consistency errors: if an object is visible to more than one thread, all reads or writes to that object's variables are done through synchronized methods. 如果一个对象对多线程是可见的,那么对改对象的读写操作都将通过同步的方式进行。网上对他的讲解千千万,很多都是一样的。接下来讲一下我对他的具体表现:

    • synchronized关键字用到的是monitor enter和monitor exit两个JVM指令(请用javap命令自行研究),且遵循happens-before规则。能保证在monitor enter,获取到锁之前必须从主内存获取数据,而不是线程的本地内存。在monitor exit之后变量会刷新到主内存。(这里和上面的图都涉及到JMM模型,这是并发的基础,后面章节会详细介绍
    • “synchronized是一把锁”,这种理解是不严谨的。准确的来说是某线程获取了对象的monitor锁,在没有释放该锁之前,其他线程在同一时刻无法获取该锁
    • synchronized可以用于对代码块或者方法进行修饰,不能对变量进行修饰

      如果要解决之前的问题,那么在getNext()方法上加上synchronized关键字就可以解决了问题。原因就是上面提到的,当某个线程获取了monitor锁,那么其他线程是无法获取锁的。也就是说其他线程都无法执行该方法,直到其他线程放弃该锁。每一个内置锁都有且只能有一个相关联的条件队列(这里的设计是否好呢?),当一个线程获取锁进行操作的时候,其他线程都在这个队列里等待该锁。那么解决掉问题也了解最基本的保证线程安全的方法之后,我们来看一下JDK对synchronized的优化以及synchronized的弊端。

    1.2.2 synchronized的优化

    • 自旋锁
      • 自旋锁在JDK1.4引入,在JDK1.6默认开启。自旋锁到底是什么呢?之前我们说的互斥锁对性能的影响很大,Java线程是映射到操作系统的原生线程上的,如果要阻塞或者唤醒一个线程就需要操作系统的帮助,因此状态转换需要花费很多CPU时间。因为锁定的状态一般只会持续很短很短的时间,为了这段时间去挂起然后再唤醒是很不值得的。如果服务器有多个处理器,我们就可以让后面的线程稍微等等,但是并不放弃CPU执行时间,这个稍微等等的过程就是自旋。
      • 自旋锁和阻塞锁很大的区别就是是否要放弃CPU执行时间
    • 锁消除
      • 锁消除是JIT编译器对锁的具体实现所做的一种优化,如果同步块所使用的锁对象通过逃逸分析出只有一个线程会访问,那么JIT编译器在编译这个同步块的时候会消除同步
    • 锁粗化
      • 如果在一段代码中对一个对象反复加锁解锁,那么会放宽锁的范围,减少性能消耗。

     如以下代码:

    for(int i=0;i<100000;i++){  
        synchronized(this){  
            do();  
    } 

    粗化成:

    synchronized(this){  
        for(int i=0;i<100000;i++){  
            do();  
    } 

    1.2.3 synchronized的死穴:锁是慢的

      虽然内置锁优化至今已经和显式锁相差无几,但是,它的死穴就是:锁是慢的。让我们来做一个实验,一个单线程对一个数字相加1kw次,加锁和不加锁的时间的对比。

    /**
     * 对比有无锁的测试类。
     *
     * @author GrimMjx
     */
    public class CompareLockTest {
    
        private int i = 0;
    
        private int y = 0;
    
        public void addWithNoLock() {
            i++;
        }
    
        public synchronized void addWithLock() {
            y++;
        }
    
        public static void main(String[] args) {
            // no lock
            CompareLockTest noLockTest = new CompareLockTest();
            StopWatch stopWatch = new StopWatch();
    
            stopWatch.start();
            for (int index = 0; index < 10000000; index++) {
                noLockTest.addWithNoLock();
            }
            stopWatch.stop();
            System.out.println("no lock: " + stopWatch.getTotalTimeMillis());
    
    
            // with lock
            stopWatch.start();
            for (int index = 0; index < 10000000; index++) {
                noLockTest.addWithLock();
            }
            stopWatch.stop();
            System.out.println("with lock: " + stopWatch.getTotalTimeMillis());
        }
    }

      结果不加锁的大概是7毫秒,加锁大概是250毫秒。这还只是单线程,如果是多线程呢?并发很难而锁的性能糟糕。线程就像是两兄弟为一个玩具争吵,操作系统就像是父母来决定他们谁拿玩具。

    1.2.4 如何加锁

      我们碰到最多的问题就是若没有则添加,我们来看一个例子,先写一个错误的加锁方式,后写一个正确的方式。

    /**
     * list测试类。
     *
     * @author GrimMjx
     */
    public class ListTest {
    
        public List<String> list = Collections.synchronizedList(new ArrayList<String>());
    
        /**
         * 非线程安全
         *
         * @param element
         * @return
         */
        public synchronized boolean unsafePutIfAbsent(String element) {
            boolean absent = !list.contains(element);
            if (absent) {
                list.add(element);
            }
            return absent;
        }
    
        /**
         * 线程安全
         *
         * @param element
         * @return
         */
        public boolean safePutIfAbsent(String element) {
            synchronized (list) {
                boolean absent = !list.contains(element);
                if (absent) {
                    list.add(element);
                }
                return absent;
            }
        }
        
        // ...其他对list操作的方法
    }

      第一个方法为何不是线程安全的?方法不是也已经用synchronized修饰了么?这个list也是线程安全的。对不对?问题在于在错误的锁上进行了同步,只是带来了同步的假象,这就意味着该方法相对于List的其他操作来说并不是原子的。因此无法确保当方法执行的时候,另外一个线程不会修改链表。

      第二个方法是正确的线程安全的,最重要的是因为list在外部加锁时要使用同一个锁。对于使用list的代码,使用list本身用于保护其状态的锁来保护这段代码。说白了就是你要知道你获取的什么锁,锁的是什么对象,这个是一定要搞清楚的。

    1.3 死锁

    1.3.1 死锁的介绍

      在多线程访问共享资源的情况下,如果对线程驾驭不当很容易引起死锁的情况发生。死锁又分:交叉锁、数据库锁等。比如说数据库锁,如果A线程执行了select xxx for update语句退出了事务,那么别的线程访问都将陷入死锁。简而言之,死锁说白了就是“我在等你,你也在等我”。还是写个例子吧。

    /**
     * 死锁测试类。
     *
     * @author GrimMjx
     */
    public class DeadLockTest {
    
        public static void main(String[] args) {
            Object a = new Object();
            Object b = new Object();
    
            new Thread(()->{
                synchronized (a) {
                    System.out.println("已经锁住a了");
                    synchronized (b){
                        System.out.println("同时锁住a和b了");
                    }
                }
            }).start();
    
            new Thread(()->{
                synchronized (b) {
                    System.out.println("已经锁住b了");
                    synchronized (a){
                        System.out.println("同时锁住a和b了");
                    }
                }
            }).start();
        }
    }

      如果A线程已经获取a对象的锁,现在想要获取b对象的锁。此时B线程已经获取b对象的锁,想要获取a对象的锁。那么如果两个线程都不释放已经持有对象的锁,大家都无法拿到第二个对象的锁。如果程序出现死锁,可以利用jstack等工具进行分析。

      

  • 相关阅读:
    Linux关闭防火墙和selinux
    Linux内存VSS,RSS,PSS,USS解析
    JS 将有父子关系的数组转换成树形结构数据
    npm install报错类似于npm WARN tar ENOENT: no such file or directory, open '*** ode_modules.staging***
    react-native之文件上传下载
    Markdown语法简记
    MySQL运维开发
    股票投资
    数据仓库原理与实战
    python基础
  • 原文地址:https://www.cnblogs.com/GrimMjx/p/10049342.html
Copyright © 2020-2023  润新知