• HashMap使用initalCapacity初始化值进行性能优化


    https://www.cnblogs.com/damoblog/p/14214928.html

      我们一般在使用new HashMap<T>()时,有时候不会做容量大小的设置。但是这样使用的结果是可能会造成一些内存浪费;因此,知道存储的键值对的数量的情况下,做初始化较好。

    一、创建HashMap

      新建一个HashMap的时候,可以通过initialCapacity设置HashMap长度的初始化值。如:Map<String, Object> resultMap = new HashMap<String, Object>(initialCapacity: 5);
    在hashMap源码中initialCapacity的初始值为16,负载因子为0.75;所以一个hashMap中默认存储长度为16 * 0.75 = 12,也就是如果hashMap.put的键值对数量小于12的时候,hashMap位置够用;
    但是当添加的键值对数超过12后,hashMap需要扩容,一倍,也就是长度从12扩容到24;例如键值对一共13个,这样剩余11个位置性能都浪费了,那么如果已知需要添加的键值对数量,就可以通过
    设置initialMap的值,来避免hashMap扩容,减少性能消耗。我们需要往hashMap中添加6个键值对,6 / 0.75 = 8;那就可以把initialCapacity设置为9比较合适,节省性能。

    二、原理

      公式是《阿里巴巴Java开发手册》中的一个建议,在Guava中也是提供了相同的算法,更甚之,这个算法实际上是JDK8中putAll()方法的实现。这是公式的得出是因为,当HashMap内部维护的哈希表的容量达到75%时(默认情况下),就会触发rehash(重建hash表)操作。而rehash的过程是比较耗费时间的。所以初始化容量要设置成expectedSize/0.75 + 1 的话,可以有效地减少冲突,也可以减小误差”。我的理解是:当数组长度是可容纳长度的75%时,就会重新建立数组,产生额外开销,所以这个预期的数组长度要小于可容纳的长度的75%,也就是 (initialCapacity – 1 ) * 0.75 = 预期数组长度 ,即 initialCapacity * 0.75 > 预期数组长度。

    三、公式

    最后,千言万语都汇成最后这一个容量公式:initialCapacity = expectedSize/0.75 + 1

  • 相关阅读:
    python的复制,深拷贝和浅拷贝的区别(转)
    linux下ffmpeg安装(转)
    Linux下的tar压缩解压缩命令详解(转)
    centos7安装python-pip(转)
    爬山算法和模拟退火算法简介
    协方差、协方差矩阵定义与计算
    七种常见阈值分割代码(Otsu、最大熵、迭代法、自适应阀值、手动、迭代法、基本全局阈值法)
    Canny边缘检测算法原理及其VC实现详解(二)
    Canny边缘检测算法原理及其VC实现详解(一)
    perforce变量配置与使用
  • 原文地址:https://www.cnblogs.com/guanghuiqq/p/15187065.html
Copyright © 2020-2023  润新知