HashMap使用initalCapacity初始化值进行性能优化

HashMap使用initalCapacity初始化值进行性能优化

https://www.cnblogs.com/damoblog/p/14214928.html

　　我们一般在使用new HashMap<T>()时，有时候不会做容量大小的设置。但是这样使用的结果是可能会造成一些内存浪费；因此，知道存储的键值对的数量的情况下，做初始化较好。

一、创建HashMap

　　新建一个HashMap的时候，可以通过initialCapacity设置HashMap长度的初始化值。如：Map<String, Object> resultMap = new HashMap<String, Object>(initialCapacity: 5);
在hashMap源码中initialCapacity的初始值为16，负载因子为0.75；所以一个hashMap中默认存储长度为16 * 0.75 = 12，也就是如果hashMap.put的键值对数量小于12的时候，hashMap位置够用；
但是当添加的键值对数超过12后，hashMap需要扩容，一倍，也就是长度从12扩容到24；例如键值对一共13个，这样剩余11个位置性能都浪费了，那么如果已知需要添加的键值对数量，就可以通过
设置initialMap的值，来避免hashMap扩容，减少性能消耗。我们需要往hashMap中添加6个键值对，6 / 0.75 = 8；那就可以把initialCapacity设置为9比较合适，节省性能。

二、原理

　　公式是《阿里巴巴Java开发手册》中的一个建议，在Guava中也是提供了相同的算法，更甚之，这个算法实际上是JDK8中putAll()方法的实现。这是公式的得出是因为，当HashMap内部维护的哈希表的容量达到75%时（默认情况下），就会触发rehash（重建hash表）操作。而rehash的过程是比较耗费时间的。所以初始化容量要设置成expectedSize/0.75 + 1 的话，可以有效地减少冲突，也可以减小误差”。我的理解是:当数组长度是可容纳长度的75%时，就会重新建立数组,产生额外开销，所以这个预期的数组长度要小于可容纳的长度的75%，也就是 (initialCapacity – 1 ) * 0.75 = 预期数组长度，即 initialCapacity * 0.75 > 预期数组长度。

三、公式

最后，千言万语都汇成最后这一个容量公式：initialCapacity = expectedSize/0.75 + 1
相关阅读:
python的复制，深拷贝和浅拷贝的区别(转)
linux下ffmpeg安装(转)
Linux下的tar压缩解压缩命令详解(转)
centos7安装python-pip（转）
爬山算法和模拟退火算法简介
 协方差、协方差矩阵定义与计算
 七种常见阈值分割代码(Otsu、最大熵、迭代法、自适应阀值、手动、迭代法、基本全局阈值法)
Canny边缘检测算法原理及其VC实现详解(二)
Canny边缘检测算法原理及其VC实现详解(一)
perforce变量配置与使用
原文地址：https://www.cnblogs.com/guanghuiqq/p/15187065.html

HashMap使用initalCapacity初始化值进行性能优化

一、创建HashMap

二、原理

三、公式