并发编程-ConcurrentHashMap（一）

本篇来聊聊1.8的ConcurrentHashMap（CHS），关于它的一些设计思想（高低位扩容、链式寻址法、链表 so on），数据结构，和源码试实现行剖析，本篇会讲到前面的一部分代码分析，包括（延迟初始化、阈值判断扩容、以及高低位扩容）

为什么使用CHS

【HashMap】是非线程安全的，有时候因为没有给使用【HashMap】的代码段加同步锁，在1.7的时候居然导致了死锁，。那我们就使用【Hashtable】，他是可以保证线程安全，但是他只是粗暴的加上了synchronized关键字，这样锁的粒度太粗（性能很低）。所以当多线程场景下CHS就应运而生。

CHS的使用

平常的新增，删除等一些操作这里我们不再继续了解，咱们了解一下在1.8后加的一些新的方法【computeIfAbsent 】【computeIfPresent】【computeIfPresent】【compute】【merge】我这里分别写了个例子，所以不再赘述

CHS存储和实现

总体来说，他是基于一个数组进行数据的存储，数组中的每个元素都叫做一个节点，并且分为两种方式，

【链表】：是用来解决哈希冲突的，我们在说threadlocal的时候说到过，用的是线性探索进行解决的

【红黑树】：用来解决链表过于长，带来的时间复杂度增加的问题，红黑树使得时间复杂度从【O(n)->O(logn)】

！！！node长度超过64的时候，链表长度超过8的时候，则进行红黑树的转换，当做扩容的时候，红黑树会转换成节点，因为当扩容的时候，数据会进行拉伸，伴随着，数据结构无法达到红黑树的条件，从而转变

总体视角：

当我们put一个数据的时候，首先会用你put的key的哈希值计算一个数组下标

如果我们put key的哈希数值一样的话,则加入此节点的下面，就变成了一个单项列表。

CHS源码分析

我们发现，在new一个chs的时候没并没有创建一个新的对象，创建对象和赋值的操作都在put方法中实现的，这就是【延迟初始化】

final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    //使用你传进来的key去计算一个hash值，后面要用这个计算下标
    int hash = spread(key.hashCode());
    int binCount = 0;
    //这里是个自旋，因为是多线程里面肯定牵扯到cas的操作，那cas可能会失败，失败之后肯定要重新把这个数值传进来，所以使用自旋
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        //如果table为空则去初始化一个Node<K,V>[] table 这是存储的容器;
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        //    (n - 1) & hash这里用换算出来的hash值去计算一个下标
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            //如果当前的算出来的下标处没有数据则创建一个node并且存储数据，这里还是通过cas保障数据安全
            if (casTabAt(tab, i, null,
                         new Node<K,V>(hash, key, value, null)))
                break;                   
        }
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        //当前位置如果存储数据，则走这里的逻辑
        else {
            V oldVal = null;
            //锁住当前的node节点避免线程安全问题，这里的锁的粒度很细，因为只是锁住当前的node，意味着其他的节点，都可以在这个时候同时插入数据，这样就提升了性能
            synchronized (f) {
                if (tabAt(tab, i) == f) {
                    //这里是针对链表的操作
                    if (fh >= 0) {
                        binCount = 1;
                        //f代表的是当前node的头结点，拿到头节点开始向下遍历，binCount实际上是在统计链表的长度
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            //判断是否存在相同的key，如果存在则进行覆盖（相同的key后者会覆盖前者）
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            //如果不存在则把当前的key和value添加到链表中，这里使用的是尾插法（ = e.next），直接添加到尾部
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    //这里是针对红黑树的操作
                    else if (f instanceof TreeBin) {
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                       value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            if (binCount != 0) {
                //如果链表长度大于等于8，则会根据阈值判断是转化为红黑树还是扩容
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                if (oldVal != null) 
                    return oldVal;
                break;
            }
        }
    }
    addCount(1L, binCount);
    return null;
}

initTable（这是进行容器初始化的操作，因为是多线程情况下，所以要加锁，这是使用CAS充当了锁）这里的【sizeCtl 】等于是一个状态机，去标识当前数组扩容的状态

private final Node<K,V>[] initTable() {
    Node<K,V>[] tab; int sc;
    //只要容器没有初始化就不断进行初始化
    while ((tab = table) == null || tab.length == 0) {
        if ((sc = sizeCtl) < 0)
            Thread.yield(); 
        //因为是多线程，所以这里使用cas保证原子性
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
            try {
                if ((tab = table) == null || tab.length == 0) {
                    //这里的默认长度是16
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    @SuppressWarnings("unchecked")
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    table = tab = nt;
                    //这里保留扩容的阈值（当数组长度到达扩容的阈值的时候，就进行扩容）
                    sc = n - (n >>> 2);
                }
            } finally {
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

treeifyBin（这里根据阈值判断，是转换红黑树，还是扩容，前面说了数组长度到达64的时候才会转换为红黑树）

private final void treeifyBin(Node<K,V>[] tab, int index) {
    Node<K,V> b; int n, sc;
    if (tab != null) {
        //如果table长度小于64则进行扩容，否则进行红黑树的转换
        if ((n = tab.length) < MIN_TREEIFY_CAPACITY)
            //进行扩容
            tryPresize(n << 1);
        else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {
            //进行红黑树的转换
            synchronized (b) {
                if (tabAt(tab, index) == b) {
                    TreeNode<K,V> hd = null, tl = null;
                    for (Node<K,V> e = b; e != null; e = e.next) {
                        TreeNode<K,V> p =
                            new TreeNode<K,V>(e.hash, e.key, e.val,
                                              null, null);
                        if ((p.prev = tl) == null)
                            hd = p;
                        else
                            tl.next = p;
                        tl = p;
                    }
                    setTabAt(tab, index, new TreeBin<K,V>(hd));
                }
            }
        }
    }
}

tryPresize（对数组进行扩容）：这里牵扯到一个【多线程并发扩容】，简而言之，就是允许多个线程对数组协助扩容，

扩容的本质：

每次把数组的长度扩大到原来的一倍
然后把老的数据迁移到新的数组

private final void tryPresize(int size) {
    //用于判断扩容的目标大小
    int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
        tableSizeFor(size + (size >>> 1) + 1);//这里就是为了满足2m³，如果是15那就给你转化成16（转换成最近的2m³）
    int sc;
    //说明要做数组的初始化，因为这个方法在别的地方也有使用，所以要进行判断
    while ((sc = sizeCtl) >= 0) {
        Node<K,V>[] tab = table; int n;
        //这里进行数组的初始化
        if (tab == null || (n = tab.length) == 0) {
            //这里数组容量是通过对比的计算出来的，初始容量(我们可以自定义chm的大小)和扩容容量，谁的数字大就选择谁作为数组的默认长度
            n = (sc > c) ? sc : c;
            if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                try {
                    if (table == tab) {
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = nt;
                        sc = n - (n >>> 2);
                    }
                } finally {
                    sizeCtl = sc;
                }
            }
        }
        //已经是最大的容量，则不进行扩容了，直接返回
        else if (c <= sc || n >= MAXIMUM_CAPACITY)
            break;
        else if (tab == table) {
            //这里生成一个扩容戳，这是为了保证当前扩容范围的唯一性（使用多线程来执行分段扩容），我们在下面聊聊这个东西，他挺有意思的

            int rs = resizeStamp(n);
            //第一次扩容的时候，不会走这一段逻辑,因为sc不小于1
            if (sc < 0) {
                Node<K,V>[] nt;
                //表示扩容结束
                if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                    sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                    transferIndex <= 0)
                    break;
                //表示没有结束，所以每次增加一个线程进行扩容，则在【低位】加一，当扩容结束后低位就开始递减，证明线程一个个开始释放，最终低位全部都是0，则说明扩容完毕
                if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
　　　　　　　　　　　　//这里实现数组的数据转移
                    transfer(tab, nt);
            }
　　　　　　　　//第一次走这个逻辑，他会把我们上面算出的rs左移16位 就会变成(换算的结果看下面的resizeStamp分析)-> 1000 0000 0001 1011 0000 0000 0000 0000
　　　　　　　　//算出来的戳的 【高16位】标识当前的额扩容标记,【低16位】标识当前扩容的线程数量
　　　　　　　　//然后对换算出来的结果加2 （2的二进制是10） 
　　　　　　　　//于是就变成了 1000 000 0001 1011 0000 0000 0000 0010 （上面讲高位标识扩容标记，低位表示扩容的线程数量，那这里就是一个线程在参加扩容）
            else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                         (rs << RESIZE_STAMP_SHIFT) + 2))
                transfer(tab, null);
        }
    }
}

因为是多线程共同参与数据的迁移，那我肯定要有一个地方记录参与这个任务的线程数量

【numberOfLeadingZeros】:这个方法会【返回这个数据的二进制串中从最左边算起连续的“0”的总数量】，

- - 例如一个int类型的长度是32 【0000 0000 0000 0000 0000 0000 0000 0000】现在在17位这里有一个1，那就在前面有16个0这个时候这个方法就会返回16 【0000 0000 0000 0000 1000 0000 0000 0000】

static final int resizeStamp(int n) {
　　//把前面计算出来的二进制的第16位变成1，比如说现在key计算出来的是16 那转换出来的二进制就是10000 因为int是32位所以给他前面补充0就变成了
　　//0000 0000 0000 0000 0000 0000 0001 0000 ->那他最高位数前面的数字就有27个0就返回27
　　// 27换算出来的二进制是 【11011】 给前面补充0之后就变成了 0000 0000 0000 0000 0000 0000 000 1 1011
　// 给他的第16位变成1那就变成->0000 0000 0000 0000 1000 0000 0001 1011

　　return Integer.numberOfLeadingZeros(n) | (1 << (RESIZE_STAMP_BITS - 1));
}

相关阅读:
4.计算机启动过程的简单介绍计算机启动流程计算机BIOS作用 POST 开机自检计算机启动顺序分区表操作系统启动
 3.操作系统简单介绍操作系统发展历史批处理分时系统操作系统是什么操作系统对文件的抽象进程虚拟内存是什么操作系统作用操作系统功能
 2.计算机组成-数字逻辑电路门电路与半加器异或运算半加器全加器组成全加器结构反馈电路振荡器存储 D T 触发器循环移位计数器寄存器传输门电路译码器晶体管 sram rom 微处理计算机
 1.计算机发展阶段计算机发展历史机械式计算机机电式计算机电子计算机逻辑电路与计算机二极管电子管晶体管硅门电路计算机电磁学计算机二进制
 如何解决svn清理失败不能更新 cleanup失败 cleanup乱码更新乱码 svn更新提示清理清理乱码不能清理 svn故障修复SVN cleanup 陷入死循环 svn cleanup时遇到错误怎么办
 eclipse svn插件卸载重新安装 Subclipse卸载安装 The project was not built since its build path is incomplete This client is too old to work with the working copy at
java for循环里面执行sql语句操作,有效结果只有一次,只执行了一次sql mybatis 循环执行update生效一次实际只执行一次
 windows资源管理器多标签打开 windows文件夹多标签浏览浏览器tab页面一样浏览文件夹 clover win8 win10 报错无响应问题怎么解决 clover卡死 clover怎么换皮肤
 批处理启动vm虚拟机服务 vm12启动无界面启动vm虚拟机系统 windows上如何操作服务 sc net启动关闭服务
 不能ssh连接ubuntu linux 服务器 secureCRT不能ssh连接服务器不能远程ssh连接虚拟机的ubuntu linux
原文地址：https://www.cnblogs.com/UpGx/p/14944486.html