• java集合框架(二):HashTable


    HashTable作为集合框架中的一员,现在是很少使用了,一般都是在面试中会问到其与HashMap的区别。为了能在求职的时候用上场,我们有必要对其原理进行解读。

    HashTable的实现原理跟HashMap类似,也是通过节点的哈希值映射到哈希桶数组,如果发生哈希碰撞就构建一条链表,简单点说就是:数组+链表

    一、类的定义

    public class Hashtable<K,V>
        extends Dictionary<K,V>
        implements Map<K,V>, Cloneable, java.io.Serializable {}

    从以上的定义中,可以发现其继承自Dictionary,而HashMap是继承自AbstractMap。Dictionary是一个字典类,内部定义了一些抽象方法,现在官方也不建议使用了。我的理解也是用来保存key-value的,不过要求key和value都不能为空。

    二、存储单元

    基本存储单元:

    private static class Entry<K,V> implements Map.Entry<K,V> {
            final int hash; // key算出的哈希值
            final K key; 
            V value;
            Entry<K,V> next; // 如果有链表的话指向下一个节点
    }

    哈希桶数组:

    private transient Entry<?,?>[] table;

    三、构造函数

     HashTable有四个构造函数,可以按照需要进行选择。一般情况下,如果知道节点数量,可以在初始化的时候指定哈希桶的容量。

    // 无参构造器
    public Hashtable() {
            this(11, 0.75f); // 默认哈希桶初始容量为11,负载因子为0.75
    }
    // 自定义初始哈希桶容量构造器
    public Hashtable(int initialCapacity) {
            this(initialCapacity, 0.75f);
    }
    // 自定义容量和负载因子构造器,负载因子一般情况下使用0.75
    public Hashtable(int initialCapacity, float loadFactor) {
            if (initialCapacity < 0)
                throw new IllegalArgumentException("Illegal Capacity: "+
                                                   initialCapacity);
            if (loadFactor <= 0 || Float.isNaN(loadFactor))
                throw new IllegalArgumentException("Illegal Load: "+loadFactor);
    
            if (initialCapacity==0)
                initialCapacity = 1;
            this.loadFactor = loadFactor;
            // 初始化哈希桶数组
            table = new Entry<?,?>[initialCapacity];
            // 初始化扩容阈值,节点超过这个值会进行扩容,其中MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8
            threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    }
    // 可以在构造器中传入Map,其全部元素会put到新构建的HashTable中
    public Hashtable(Map<? extends K, ? extends V> t) {
            this(Math.max(2*t.size(), 11), 0.75f);
            putAll(t);
    }

    四、存储实现

    HashTable的put、get方法都使用了同步加锁,所以他们是线程安全的。

    1.put方法

    // 该方法使用同步加锁
    public synchronized V put(K key, V value) {
            // Make sure the value is not null
            // 值不能为空
            if (value == null) {
                throw new NullPointerException();
            }
    
            // Makes sure the key is not already in the hashtable.
            Entry<?,?> tab[] = table;
            // key直接获取哈希值,因此key不能为空,否则会抛空指针异常
            int hash = key.hashCode();
            // 计算在哈希桶的位置
            int index = (hash & 0x7FFFFFFF) % tab.length;
            @SuppressWarnings("unchecked")
            Entry<K,V> entry = (Entry<K,V>)tab[index];
            // 判断index位置是否为空,不为空判断hash和key是否相等,相等的话覆盖原有的value
            for(; entry != null ; entry = entry.next) {
                if ((entry.hash == hash) && entry.key.equals(key)) {
                    V old = entry.value;
                    entry.value = value;
                    return old;
                }
            }
            // 添加新节点
            addEntry(hash, key, value, index);
            return null;
    }
    // 添加新节点到哈希桶
    private void addEntry(int hash, K key, V value, int index) {
            // 修改数加一,fast-fail机制
            modCount++;
    
            Entry<?,?> tab[] = table;
            // 判断是否需要扩容,节点总数等于等于阈值就会扩容,阈值一般等于容量乘以0.75
            if (count >= threshold) {
                // Rehash the table if the threshold is exceeded
                rehash();
    
                tab = table;
                hash = key.hashCode();
                // 计算index位置
                index = (hash & 0x7FFFFFFF) % tab.length;
            }
    
            // 创建新的节点,并放到哈希桶中,如果有链表则是链表的头部
            @SuppressWarnings("unchecked")
            Entry<K,V> e = (Entry<K,V>) tab[index];
            tab[index] = new Entry<>(hash, key, value, e);
            // 节点总数加一
            count++;
    }    

    2.get方法

    // 同步加锁
    public synchronized V get(Object key) {
            Entry<?,?> tab[] = table;
            int hash = key.hashCode();
            // 根据hash值计算在哈希桶的位置
            int index = (hash & 0x7FFFFFFF) % tab.length;
            // 如果哈希桶的位置上是链表,则遍历链表找到hash值和key都相等的对象
            for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
                if ((e.hash == hash) && e.key.equals(key)) {
                    return (V)e.value;
                }
            }
            return null;
    }

    五、扩容机制

    HashTable的扩容是把原来的容量扩大为2倍加一,并把旧哈希桶的节点重新计算哈希映射到新的哈希桶

    protected void rehash() {
            int oldCapacity = table.length;
            Entry<?,?>[] oldMap = table;
    
            // 新容量等于旧容量的两倍加1,不太清楚为什么要加一,我估计是为了平均节点到哈希桶,减少哈希碰撞
            int newCapacity = (oldCapacity << 1) + 1;
            if (newCapacity - MAX_ARRAY_SIZE > 0) {
                // 如果就容量已经达到最大值就不在扩容了,MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8
                if (oldCapacity == MAX_ARRAY_SIZE)
                    return;
                newCapacity = MAX_ARRAY_SIZE;
            }
            Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];
    
            modCount++;
            // 计算阈值
            threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
            table = newMap;
    
            // 从哈希桶的最后位置遍历旧节点到新的哈希桶,这个过程比较耗性能,
            // 需要重新指定每个节点位置,重新构建链表的组成
            for (int i = oldCapacity ; i-- > 0 ;) {
                for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
                    Entry<K,V> e = old;
                    old = old.next;
    
                    int index = (e.hash & 0x7FFFFFFF) % newCapacity;
                    e.next = (Entry<K,V>)newMap[index];
                    // 如果是链表则在头部插入新的节点
                    newMap[index] = e;
                }
            }
    }

    六、遍历实现

    HashTable的遍历操作也是线程安全的,通过调用Collections.synchronizedSet()的方法,给遍历操作加了一个包装器。里面对key、value或者key-value的遍历实现还是挺有借鉴意思的,它用泛型只要写一次代码就可以实现三种遍历方式。

    // 该方法返回一个Set,其实遍历只需要迭代器,entrySet返回的Set对象实现了迭代器
    public Set<Map.Entry<K,V>> entrySet() {
            if (entrySet==null)
                // 返回线程安全的集合类,这里是通过线程安全的方法对目标方法做了一层包装
                entrySet = Collections.synchronizedSet(new EntrySet(), this);
            return entrySet;
    }

    简单看看EntrySet的实现

    // 只看迭代器部分
    private class EntrySet extends AbstractSet<Map.Entry<K,V>> {
            public Iterator<Map.Entry<K,V>> iterator() {
                return getIterator(ENTRIES);
            }
    }
    private <T> Iterator<T> getIterator(int type) {
            // 判断节点数是否为0
            if (count == 0) {
                return Collections.emptyIterator();
            } else {
                return new Enumerator<>(type, true);
            }
    }
    // HashTable的内部类,可以共用外部类的属性和方法
    private class Enumerator<T> implements Enumeration<T>, Iterator<T> {
            Entry<?,?>[] table = Hashtable.this.table;
            int index = table.length;
            Entry<?,?> entry = null;
            Entry<?,?> lastReturned = null;
            int type;
    
            boolean iterator;
    
            protected int expectedModCount = modCount;
    
            Enumerator(int type, boolean iterator) {
                this.type = type;
                this.iterator = iterator;
            }
    
            public boolean hasMoreElements() {
                Entry<?,?> e = entry;
                int i = index;
                Entry<?,?>[] t = table;
                // 从哈希桶的最后遍历节点
                while (e == null && i > 0) {
                    e = t[--i];
                }
                entry = e;
                index = i;
                return e != null;
            }
    
            @SuppressWarnings("unchecked")
            public T nextElement() {
                Entry<?,?> et = entry;
                int i = index;
                Entry<?,?>[] t = table;
                // 如果当前节点为空,表示index位置的节点遍历完了,则继续遍历哈希桶
                while (et == null && i > 0) {
                    et = t[--i];
                }
                entry = et;
                index = i;
                if (et != null) {
                    Entry<?,?> e = lastReturned = entry;
                    entry = e.next;
                    // 这里使用了泛型可以返回key,value或者key-value对象
                    return type == KEYS ? (T)e.key : (type == VALUES ? (T)e.value : (T)e);
                }
                throw new NoSuchElementException("Hashtable Enumerator");
            }
    
            // 迭代器方法
            public boolean hasNext() {
                return hasMoreElements();
            }
     
            // 迭代器方法
            public T next() {
                // fast-fail机制
                if (modCount != expectedModCount)
                    throw new ConcurrentModificationException();
                return nextElement();
            }
            // 迭代器方法,删除节点
            public void remove() {
                if (!iterator)
                    throw new UnsupportedOperationException();
                if (lastReturned == null)
                    throw new IllegalStateException("Hashtable Enumerator");
                if (modCount != expectedModCount)
                    throw new ConcurrentModificationException();
    
                synchronized(Hashtable.this) {
                    Entry<?,?>[] tab = Hashtable.this.table;
                    int index = (lastReturned.hash & 0x7FFFFFFF) % tab.length;
                    // 找出当前要删除的节点在哈希桶的位置
                    @SuppressWarnings("unchecked")
                    Entry<K,V> e = (Entry<K,V>)tab[index];
                    // 遍历index位置的链表
                    for(Entry<K,V> prev = null; e != null; prev = e, e = e.next) {
                        // 找出当前遍历的节点
                        if (e == lastReturned) {
                            modCount++;
                            expectedModCount++;
                            // 判断是否在链表的头部
                            if (prev == null)
                                tab[index] = e.next;
                            else
                                prev.next = e.next;
                            count--;
                            lastReturned = null;
                            return;
                        }
                    }
                    throw new ConcurrentModificationException();
                }
            }
        }

    七、总结

    HashTable的数据结构跟HashMap类似,下面总结一下他们的区别:

    1. key-value是否可以为空。HashTable的key和value都不可以为空,为空会报空指针异常。HashMap的key,value都可以为空,但是key只能有一个为null,value都可以为空。
    2. 是否线程安全。HashTable操作节点的方法都是同步加锁的,所以是线程安全的。HashMap不是线程安全的。
    3. 类继承关系是否一样。HashTable继承Dictionary。HashMap继承AbstractMap。
    4. 初始容量。HashTable初始容量为11。HashMap初始容量为16。
    5. 最大容量(哈希桶的容量,不是存储元素的容量)。HashTable最大为Integer.MAX_VALUE - 8=2147483639。HashMap最大为1<<30=1073741824。

    以上就是我对HashTable的解读,如果有错误之处,欢迎批评和指正。

  • 相关阅读:
    Sql Server2000里面获得数据库里面所有的用户表名称 和对应表的列名称
    c#开发windows应用程序几个小技巧
    "Unexpected Error 0x8ffe2740 Occurred" Error Message When You Try to Start a Web Site
    注册asp.net到iis
    O/R Mapping 影射文件生成的一点研究(暂时放在这里,实现以后再进行总结)
    WMI使用集锦
    NHibernate快速指南
    项目打包以前需要删除的文件
    Asp.Net 学习资源列表
    精彩Blog
  • 原文地址:https://www.cnblogs.com/jenkinschan/p/10542286.html
Copyright © 2020-2023  润新知