个人博客网:https://wushaopei.github.io/ (你想要这里多有)
Java 中提供了很多的集合类,包括,collection的子接口list、set,以及map等。由于它们的底层构成不同,以及数据的构造为单列、多列、可重复、不可重复,导致其扩容机制也不尽相同。
一、List
获取ArrayList 容量大小的方法:
1、ArrayList
ArrayList以数组的形式存储。ArrayList中与容量有关的构造器有两个,代码如下:
由以上代码可知,ArrayList 的容量扩容包含有 ArrayList(int initialCapacity) ,另一个则是 ArrayList() ;
第一个构造器在初始创建时以形参将容量大小进行定义,由外部自定义;第二个构造器没有传入参数,使用默认初始化的容量大小;详细解析如下:
第一个有参构造器:自定长度在后面,这里先看无参有默认容量长度的构造器怎么实现的扩容?
第二个无参构造器:
代码测试:
在上述单元测试中,创建了一个无参构造的ArrayList 集合,并对其进行元素的添加,以满足对元素添加过程中容量大小的扩张规则。
上述是单元测试结果,在这里做一番分析:
在以上的代码中,默认使用ArrayList的初始化容量长度,在ArrayList中,默认初始化容量是 10 ,
从测试结果可以看到,当元素的长度为3时,其容量为默认的值 10 ; 当添加的元素超过初始容量后,即 12 > 10 时,集合进行了自动扩容,添加每一个元素都会调用 ensureCapacityInternal(int minCapacity) 方法,在该方法中比较长度是否达到当前容量的边缘,将比较的结果 覆盖原来的 minCapacity 参数,该值用于保存当前的容器元素长度;如单元测试中,当元素个数超过默认的 值 10 时,会调用
方法,并接着调用 ensureExplicitCapacity(minCapacity);方法,该方法会对当前集合长度与最大容量值进行比较,并调用 grow(minCapacity) 方法进行位移扩容:
实现ArrayList 集合扩容的代码如下:
在集合长度超过初始值或当前最大值时,在 grow(int minCapacity) 方法中,进行了扩容,该扩容如代码所示, 声明当前集合的最大容量为 oldCapacity , 新增的长度为 oldCapacity 右位移一位数,当容量为 10 时,二进制为 “8020” >> 1 右移后为 “0401” ,十进制值为 5 ,此时将 oldCapacity + 位移后的值 即 10 + 5 = 15 。
此时完成扩容,newCapacity = 15 就是 ArrayList 扩容后的最新容量大小。
根据扩容规则可知,容量的递增可预计为 0 、10、15、22、33、49,以此类推。
注意: 这里对新的容量 newCapacity 和 当前元素长度进行比较,如果元素添加的比较多,超过当次位移扩容的容量大小,则会 直接使用 hugeCapacity 方法进行扩容,
第一个有参构造器:
单元测试:
① 当声明的容量小于默认初始值10 时,会在超过初始容量10 后进行扩容,
测试结果:
②超过初始化容量的元素增加:
超过初试容量后,第一次扩容会直接使用当前集合长度作为 oldCapacity 进行扩容
2、LinkedList
链表结构,且是是双向链表, 不涉及扩容的问题。
3、Vector
Vector与ArrayList一样,是存储在数组结构中。 与扩容机制相关的构造器有三个,分别是
- Vector(int initialCapacity, int capacityIncrement),
- Vector(int initialCapacity)
- Vector()
其实这后两个最终都是调用了第一个构造器,不过是使用了不同的默认参数,initialCapacity是初始容量,默认是10,capacityIncrement 是每次扩容时候的递增数量,如果该数值不等于0则每次扩容的时候是原来的二倍,如果该数值大于0,则每次增长的数量等于该数值
比如:
Vector<String> v = new Vector<String>(); // 10 20 ,40 80 ,160,320 的速度递增
Vector<String> v2 = new Vector<>(5,3);// 5 8 11 14 17 ,20,23 的速度递增。
他的加载因子也是10
4、Stack
继承于Vector,所以他的扩容机制等同于Vector的默认情况,也就是2倍速度扩容,加载因子为1
二、Map
获取Map集合容量大小的方法:
思路:利用反射获取hashmap里的threshold(扩容上限)除以 负载因子 就得到容器大小了。
1、HashMap 的扩容机制:
在HashMap 中,与容量有关的构造器有三个:
1.1 这里先对 public HashMap( )做单元测试,并进行分析
单元测试结果:
在这里先对单元测试结果进行分析:
首先我们先看一下,单元测试中,创建了一个默认无参的HashMap,此时第一次打印 集合实例的 容量值,得到的结果是 "已占用容量 0",这里对代码进行分析:
这里是通过反射获取 HashMap 字节码对象从而得到运行时的构造器或方法实例及相应的属性的值,
以上的一条代码便是获取 “threshold ” 私有属性的方法,这里看一看该变量在 HashMap 中的含义:
由注释我们可以知道,当前字段在 HashMap 用于存储 key 字段元素的长度,当初始化一个无参构造时,在没有对其进行分配元素的情况下,该字段是不会被分配值的,默认值表示值为 0 或 为初始化长度 DEFAULT_INITIAL_CAPACITY 。
以上是HashMap中的源码部分对 默认初始容量的定义: 默认长度为 16 。
以上是为了说明一个问题,在默认定义HashMap 集合容量且没有添加元素到容器中的情况下, 其容量值 可能是0 ,也可能是初始容量16.
第一条打印结果分析完毕。
以下对HashMap 的 扩容机制进行一番分析,这里会基于单元测试后面的三条打印结果进行分析:
从打印的结果,我们可以看到,第一次打印结果中,集合的实际容量为 16 ,而根据 HashMap 的加载因子来计算,当添加的元素达到长度 0.75 时会进行一次扩容。这里从源码方面进行分析:
1.2 此处要搞清楚为什么加载因子是0.75?
在以上源码中,空参构造中,不会对容量大小进行自定义声明,而是使用默认值 16 ,方法中的成员变量 this.loadFactor 代表当前集合的加载因子,即满足一定条件进行容量扩张。其中的
这里解决了加载因子为什么是 0.75 的问题,不过,在HashMap提供的构造器中,加载因子也是可以自定义的,就在这里给分析一下:
有上述源码可以知道, map的容量与加载因子可以同时被自定义声明,在构造函数中会对容量的合法性进行校验:
1.3 在这里我们提出一个问题:HashMap中容量的最大值是什么?
我们看看源码中的这一句,
当容量大于HashMap 定义的私有变量 MAXIMUM_CAPACITY 时,
在HashMap 中对 MAXIMUM_CAPACITY 的值定义的大小是:
从这里可以知道,hashmap的最大容量是 2的30次方。
1.4 Hashmap 的 扩容机制
在 HashMap 在扩容的过程中有几个问题要注意:
- key 值不可重复与 value 值不可重复的问题?
- 容量长度的扩容机制?
在这里就不对第一个问题进行过多赘述,可以参考 笔者的另一篇博文,
从源码看: hashset如何保证值不会被重复的 在该博文中对key值和value值不可重复做了详尽的分析。
添加元素到HashMap 集合中,
进入 put ()方法中,进行新元素的添加:
在上述源码中,会对传入的key 进行值重复的校验,具体使用 key 进行hash运算获取在 当前 集合中的 hash 值,如下:
在 put 方法中,对元素 key-value 添加到集合容器的操作是在 putVal() 方法中实现的,并且在该方法中调用 resize () 方法对集合容量长度进行扩容。
使用DEBUG分析查看 putVal方法中的 参数,当前 map 集合的长度为 8 ,有八个key ,每个 key 对应一个value
根据源码我们可以知道,hashmap的底层是由数组和链表构成的,如上图中, Node<K,V> [ ] tab 代表当前map集合的底层结构,该结构由一个Node (链表)类型的数组构成。每个新添加的 key-value 会以一个 Node<K,V> 的链表节点的形式被添加到 集合 tab 中 。
在添加元素的时候会调用 resize()方法,并在resize() 方法中将新的集合数据存储到 table 私有变量中:
以下是resize() 的代码:
在以上源码中,关于扩容部分的代码是:
HashMap 中对当前的容量值使用左位移的方式, oldCap << 1 ,将集合容量扩张为当前的2 的N次幂。此时,我们可以知道HashMap 的扩容是新容量为当前的 2的N次方;
1.5 HashMap 集合进行扩容的时机是?
前提: 当前集合集合的链表数组中必须有值的情况下,才会触发扩容机制。
当前的集合元素长度达到了 当前给定集合的容量的0.75倍时,该链表数组进行自增左位移,默认为2的N次幂。