• 集合总结五(Hashtable的实现原理)


    一、概述

    上一篇介绍了Java8的HashMap,接下来准备介绍一下Hashtable。

    Hashtable可以说已经具有一定的历史了,现在也很少使用到Hashtable了,更多的是使用HashMap或ConcurrentHashMap。HashTable是一个线程安全的哈希表,它通过使用synchronized关键字来对方法进行加锁,从而保证了线程安全。但这也导致了在单线程环境中效率低下等问题。Hashtable与HashMap不同,它不允许插入null值和null键。

    二、属性

    Hashtable并没有像HashMap那样定义了很多的常量,而是直接写死在了方法里(看下去就知道了),所以它的属性相比HashMap来说,可以获取的信息还是比较少的。

    //哈希表
    private transient Entry<?,?>[] table;
    
    //记录哈希表中键值对的个数
    private transient int count;
    
    //扩容的阈值
    private int threshold;
    
    //负载因子
    private float loadFactor;
    

    三、方法

    1、构造方法
    public Hashtable(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
                throw new IllegalArgumentException("Illegal Capacity: "+
                                                   initialCapacity);
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
                throw new IllegalArgumentException("Illegal Load: "+loadFactor);
    
        if (initialCapacity==0)
            initialCapacity = 1;
        this.loadFactor = loadFactor;
        table = new Entry<?,?>[initialCapacity];
        threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    }
    
    public Hashtable(int initialCapacity) {
        this(initialCapacity, 0.75f);
    }
    
    public Hashtable() {
        this(11, 0.75f);
    }
    

    二话不说,上来先丢了三个构造函数。从构造函数中,我们可以获取到这些信息:Hashtable默认的初始化容量为11(与HashMap不同),负载因子默认为0.75(与HashMap相同)。而正因为默认初始化容量的不同,同时也没有对容量做调整的策略,所以可以先推断出,Hashtable使用的哈希函数跟HashMap是不一样的(事实也确实如此)。

    2、get方法
    public synchronized V get(Object key) {
        Entry<?,?> tab[] = table;
        int hash = key.hashCode();
        //通过哈希函数,计算出key对应的桶的位置
        int index = (hash & 0x7FFFFFFF) % tab.length;
        //遍历该桶的所有元素,寻找该key
        for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
            if ((e.hash == hash) && e.key.equals(key)) {
                return (V)e.value;
            }
        }
        return null;
    }
    

    跟HashMap相比,Hashtable的get方法非常简单。我们首先可以看见get方法使用了synchronized来修饰,所以它能保证线程安全。并且它是通过链表的方式来处理冲突的。另外,我们还可以看见HashTable并没有像HashMap那样封装一个哈希函数,而是直接把哈希函数写在了方法中。而哈希函数也是比较简单的,它仅对哈希表的长度进行了取模。

    3、put方法
    public synchronized V put(K key, V value) {
        // Make sure the value is not null
        if (value == null) {
            throw new NullPointerException();
        }
    
        // Makes sure the key is not already in the hashtable.
        Entry<?,?> tab[] = table;
        int hash = key.hashCode();
        //计算桶的位置
        int index = (hash & 0x7FFFFFFF) % tab.length;
        @SuppressWarnings("unchecked")
        Entry<K,V> entry = (Entry<K,V>)tab[index];
        //遍历桶中的元素,判断是否存在相同的key
        for(; entry != null ; entry = entry.next) {
            if ((entry.hash == hash) && entry.key.equals(key)) {
                V old = entry.value;
                entry.value = value;
                return old;
            }
        }
    
        //不存在相同的key,则把该key插入到桶中
        addEntry(hash, key, value, index);
        return null;
    }
    
    
    private void addEntry(int hash, K key, V value, int index) {
        modCount++;
    
        Entry<?,?> tab[] = table;
        //哈希表的键值对个数达到了阈值,则进行扩容
        if (count >= threshold) {
            // Rehash the table if the threshold is exceeded
            rehash();
    
            tab = table;
            hash = key.hashCode();
            index = (hash & 0x7FFFFFFF) % tab.length;
        }
    
        // Creates the new entry.
        @SuppressWarnings("unchecked")
        Entry<K,V> e = (Entry<K,V>) tab[index];
        //把新节点插入桶中(头插法)
        tab[index] = new Entry<>(hash, key, value, e);
        count++;
    }
    

    put方法一开始就表明了不能有null值,否则就会向你抛出一个空指针异常。Hashtable的put方法也是使用synchronized来修饰。你可以发现,在Hashtable中,几乎所有的方法都使用了synchronized来保证线程安全。

    4、remove方法

    public synchronized V remove(Object key) {
        Entry<?,?> tab[] = table;
        int hash = key.hashCode();
        int index = (hash & 0x7FFFFFFF) % tab.length;
        @SuppressWarnings("unchecked")
        Entry<K,V> e = (Entry<K,V>)tab[index];
        for(Entry<K,V> prev = null ; e != null ; prev = e, e = e.next) {
            if ((e.hash == hash) && e.key.equals(key)) {
                modCount++;
                if (prev != null) {
                    prev.next = e.next;
                } else {
                    tab[index] = e.next;
                }
                count--;
                V oldValue = e.value;
                e.value = null;
                return oldValue;
            }
        }
        return null;
    }
    

    remove方法我已经不想加注释了,跟get和put的原理差不多。如果看过上一篇的HashMap的话,或者理解了上面的put方法的话,我相信remove方法看一眼就能懂了。

    5、rehash方法

    protected void rehash() {
        int oldCapacity = table.length;
        Entry<?,?>[] oldMap = table;
    
        //扩容扩为原来的两倍+1
        int newCapacity = (oldCapacity << 1) + 1;
        //判断是否超过最大容量
        if (newCapacity - MAX_ARRAY_SIZE > 0) {
            if (oldCapacity == MAX_ARRAY_SIZE)
                // Keep running with MAX_ARRAY_SIZE buckets
                return;
            newCapacity = MAX_ARRAY_SIZE;
        }
        Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];
    
        modCount++;
        //计算下一次rehash的阈值
        threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
        table = newMap;
    
        //把旧哈希表的键值对重新哈希到新哈希表中去
        for (int i = oldCapacity ; i-- > 0 ;) {
            for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
                Entry<K,V> e = old;
                old = old.next;
    
                int index = (e.hash & 0x7FFFFFFF) % newCapacity;
                e.next = (Entry<K,V>)newMap[index];
                newMap[index] = e;
            }
        }
    }
    

    Hashtable的rehash方法相当于HashMap的resize方法。跟HashMap那种巧妙的rehash方式相比,Hashtable的rehash过程需要对每个键值对都重新计算哈希值,而比起异或和与操作,取模是一个非常耗时的操作,所以这也是导致效率较低的原因之一。

  • 相关阅读:
    编译原理 实例
    lex yacc flex bison
    图解tensorflow 源码分析
    PostgreSQL 179个场景 案例集锦
    github view source
    Java 微服务实践
    Linux kernel AIO
    Lex与Yacc学习
    OpenResty 通过 Lua 扩展 NGINX 实现的可伸缩的 Web 平台
    nginx Architecture
  • 原文地址:https://www.cnblogs.com/ttzzyy/p/9766920.html
Copyright © 2020-2023  润新知