• Java中最常用的集合类框架之 HashMap


    一、HashMap的概述

            HashMap可以说是Java中最常用的集合类框架之一,是Java语言中非常典型的数据结构。
          HashMap是基于哈希表的Map接口实现的,此实现提供所有可选的映射操作。存储的是的映射,允许多个null值和一个null键。但此类不保证映射的顺序,特别是它不保证该顺序恒久不变。
       除了HashMap是非同步以及允许使用null外,HashMap 类与 Hashtable大致相同。
       此实现假定哈希函数将元素适当地分布在各桶之间,可为基本操作(get 和 put)提供稳定的性能。迭代collection 视图所需的时间与 HashMap 实例的“容量”(桶的数量)及其大小(键-值映射关系数)成比例。所以,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。
      HashMap 的实例有两个参数影响其性能:初始容量 和加载因子容量 是哈希表中桶的数量,初始容量只是哈希表在创建时的容量。加载因子 是哈希表在其容量自动增加之前可以达到多满的一种尺度。当哈希表中的条目数超出了加载因子与当前容量的乘积时,则要对该哈希表进行 rehash 操作(即重建内部数据结构),从而哈希表将具有大约两倍的桶数。

            通常,默认加载因子 (0.75) 在时间和空间成本上寻求一种折衷。加载因子过高虽然减少了空间开销,但同时也增加了查询成本(在大多数 HashMap 类的操作中,包括 get 和 put 操作,都反映了这一点)。在设置初始容量时应该考虑到映射中所需的条目数及其加载因子,以便最大限度地减少 rehash 操作次数。如果初始容量大于最大条目数除以加载因子,则不会发生 rehash 操作。
      注意,此实现不是同步的。 如果多个线程同时访问一个HashMap实例,而其中至少一个线程从结构上修改了列表,那么它必须保持外部同步。这通常是通过同步那些用来封装列表的 对象来实现的。但如果没有这样的对象存在,则应该使用{@link Collections#synchronizedMap Collections.synchronizedMap}来进行“包装”,该方法最好是在创建时完成,为了避免对映射进行意外的非同步操作。

    Map m = Collections.synchronizedMap(new HashMap(...));
     

    二、构造函数

    HashMap提供了三个构造函数:
    HashMap():构造一个具有默认初始容量 (16) 和默认加载因子 (0.75) 的空 HashMap。
    HashMap(int initialCapacity):构造一个带指定初始容量和默认加载因子 (0.75) 的空 HashMap。
    HashMap(int initialCapacity, float loadFactor):构造一个带指定初始容量和加载因子的空 HashMap。
    这里提到了两个参数:初始容量加载因子。这两个参数是影响HashMap性能的重要参数,其中容量表示哈希表中桶的数量,初始容量是创建哈希表时的容量,加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度,它衡量的是一个散列表的空间的使用程度,负载因子越大表示散列表的装填程度越高,反之愈小。对于使用链表法的散列表来说,查找一个元素的平均时间是O(1+a),因此如果负载因子越大,对空间的利用更充分,然而后果是查找效率的降低;如果负载因子太小,那么散列表的数据将过于稀疏,对空间造成严重浪费。系统默认负载因子为0.75,一般情况下我们是无需修改的。
    HashMap是一种支持快速存取的数据结构,要了解它的性能必须要了解它的数据结构。
     

    三、数据结构

          我们知道在Java中最常用的两种结构是数组和模拟指针(引用),几乎所有的数据结构都可以利用这两种来组合实现,HashMap也是如此。实际上HashMap是一个“链表散列”,如下是它数据结构:

                                                                                       

    // Entry是单向链表。 它是 “HashMap链式存储法”对应的链表。  
    // 实现了Map.Entry接口,即getKey(),getValue(),setValue(V value),equals(Object o),hashCode()这些函数  
    static class Entry implements Map.Entry {  
        final K key;  
        V value;  
        // 指向下一个节点  
        Entry next;  
        final int hash;  
     
        // 构造函数
        // 输入参数包括"哈希值(h)", "键(k)", "值(v)", "下一节点(n)"  
        Entry(int h, K k, V v, Entry n) {  
            value = v;  
            next = n;  
            key = k;  
            hash = h;  
        }  
     
        public final K getKey() {  
            return key;  
        }  
        public final V getValue() {  
            return value;  
        }    
        public final V setValue(V newValue) {  
            V oldValue = value;  
            value = newValue;  
            return oldValue;  
        }    
        // 判断两个Entry是否相等  
        // 若两个Entry的“key”和“value”都相等,则返回true。  
        // 否则,返回false  
        public final boolean equals(Object o) {  
            if (!(o instanceof Map.Entry))  
                return false;  
            Map.Entry e = (Map.Entry)o;  
            Object k1 = getKey();  
            Object k2 = e.getKey();  
            if (k1 == k2 || (k1 != null && k1.equals(k2))) {  
                Object v1 = getValue();  
                Object v2 = e.getValue();  
                if (v1 == v2 || (v1 != null && v1.equals(v2)))  
                    return true;  
            }  
            return false;  
        }    
        // 实现hashCode()  
        public final int hashCode() {  
            return (key==null   ? 0 : key.hashCode()) ^  
                   (value==null ? 0 : value.hashCode());  
        }    
        public final String toString() {  
            return getKey() + "=" + getValue();  
        }    
        // 当向HashMap中添加元素时,绘调用recordAccess()。  
        // 这里不做任何处理  
        void recordAccess(HashMap m) {  
        }    
        // 当从HashMap中删除元素时,绘调用recordRemoval()。  
        // 这里不做任何处理  
        void recordRemoval(HashMap m) {  
        }  
    }
          从上图我们可以看出HashMap底层实现还是数组,只是数组的每一项都是一条链。其中参数initialCapacity就代表了该数组的长度。下面为HashMap构造函数的源码:
    // 找出“大于Capacity”的最小的2的幂,使Hash表的容量保持为2的次方倍
        // 算法的思想:通过使用逻辑运算来替代取余,这里有一个规律,就是当N为2的次方(Power of two),那么X%N==X&(N-1)。
        static final int tableSizeFor(int cap) {
            int n = cap - 1;
            n |= n >>> 1; // >>> 无符号右移,高位补0
            n |= n >>> 2; // a|=b的意思就是把a和b按位或然后赋值给a
            n |= n >>> 4;
            n |= n >>> 8;
            n |= n >>> 16;
            return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
        }
        // 构造一个带指定初始容量和加载因子的空HashMap
        public HashMap(int initialCapacity, float loadFactor) {
            if (initialCapacity < 0)
                throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
            if (initialCapacity > MAXIMUM_CAPACITY)
                initialCapacity = MAXIMUM_CAPACITY;
            if (loadFactor <= 0 || Float.isNaN(loadFactor))
                throw new IllegalArgumentException("Illegal load factor: " +  loadFactor);
            this.loadFactor = loadFactor;
            this.threshold = tableSizeFor(initialCapacity);
        }
        // 构造一个带指定初始容量和默认加载因子(0.75)的空 HashMap
        public HashMap(int initialCapacity) {
            this(initialCapacity, DEFAULT_LOAD_FACTOR);
        }
        // 构造一个具有默认初始容量 (16)和默认加载因子 (0.75)的空 HashMap
        public HashMap() {
            this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
        }
        // 构造一个映射关系与指定 Map相同的新 HashMap,容量与指定Map容量相同,加载因子为默认的0.75
        public HashMap(Map m) {
            this.loadFactor = DEFAULT_LOAD_FACTOR;
            putMapEntries(m, false);
        }
     
    从源码中可以看出,每次新建一个HashMap时,都会初始化一个table数组。table数组的元素为Entry节点。
     
    // Entry是单向链表。  
        // 它是 “HashMap链式存储法”对应的链表。  
        // 它实现了Map.Entry 接口,即实现getKey(), getValue(), setValue(V value), equals(Object o), hashCode()这些函数  
        static class Entry implements Map.Entry {  
            final K key;  
            V value;  
            // 指向下一个节点  
            Entry next;  
            final int hash;  
             // 构造函数。  
            // 输入参数包括"哈希值(h)", "键(k)", "值(v)", "下一节点(n)"  
            Entry(int h, K k, V v, Entry n) {  
                value = v;  
                next = n;  
                key = k;  
                hash = h;  
            }  
            ......
        }
          
    其中Entry为HashMap的内部类,它包含了键key、值value、下一个节点next,以及hash值,这是非常重要的,正是由于Entry才构成了table数组的项为链表。
    上海尚学堂java培训原作,陆续有HashMap等java技术文章奉献,请多关注。
  • 相关阅读:
    李航统计学习方法(第二版)(十五):非线性支持向量机与核函数
    Git 工作区、暂存区和版本库
    HTML DOM tabIndex 属性
    HTML DOM Style whiteSpace 属性
    gitcli (Miscellaneous) – Git 中文开发手册
    generator.next (Generator) – JavaScript 中文开发手册
    平均宽度 | min-width (Flexible Box Layout) – CSS 中文开发手册
    chrome console的使用 :评估表达式
    optparse (Operating System) – Python 中文开发手册
    typedArray.findIndex (TypedArray) – JavaScript 中文开发手册
  • 原文地址:https://www.cnblogs.com/shsxt/p/7822841.html
Copyright © 2020-2023  润新知