• HashSet怎样保证元素不重复


    文章同步更新在个人博客:HashSet怎样保证元素不重复

    都知道HashSet中不能存放重复元素,有时候可以用来做去重操作等。但是其内部是怎么保证元素不重复的呢?下面从源码去看看。

    打开HashSet源码,发现其内部维护了一个HashMap:

    public class HashSet<E>
        extends AbstractSet<E>
        implements Set<E>, Cloneable, java.io.Serializable
    {
        static final long serialVersionUID = -5024744406713321676L;
    
        private transient HashMap<E,Object> map;
    
        // Dummy value to associate with an Object in the backing Map
        private static final Object PRESENT = new Object();
    
        /**
         * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
         * default initial capacity (16) and load factor (0.75).
         */
        public HashSet() {
            map = new HashMap<>();
        }
        ...
    }
    

    HashSet的构造方法其实就是在内部实例化了一个HashMap对象。其中还会看到一个static final的PRESENT变量,这个稍候再说,其实没什么实际用处。

    想知道为什么HashSet不能存放重复对象,那么第一步当然是看它的add方法怎么进行的判重,代码如下:

    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }
    

    。。。好吧,就把元素存放在了map里面。但是值得注意的是元素值作为的是map的key,map的value则是前面提到的PRESENT变量,这个变量只作为放入map时的一个占位符而存在,所以没什么实际用处。

    其实,这时候答案已经出来了:HashMap的key是不能重复的,而这里HashSet的元素又是作为了map的key,当然也不能重复了

    HashSet怎么做到保证元素不重复的原因找到了,文章也就结束了。。。等等,顺便看一下HashMap里面又是怎么保证key不重复的吧,代码如下:

    public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
    
        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }
    

    其中最关键的一句:

    if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
    

    调用了对象的hashCode和equals方法进行的判断,所以又得出一个结论:若要将对象存放到HashSet中并保证对象不重复,应根据实际情况将对象的hashCode方法和equals方法进行重写

  • 相关阅读:
    Docker启动ubuntu容器中使用sudo后报错,bash: sudo: command not found
    Redis持久化rdb&aof
    Python3中copy模块常用功能及其他几种copy方式比较
    学习笔记:tkinter模块常用参数(python3)
    Python核心编程第二版(中文).pdf 目录整理
    11、487-3279
    10、Crashing Balloon
    9、Exponentiation
    8、Fire Net
    7、Reverse Root
  • 原文地址:https://www.cnblogs.com/nickhan/p/8550655.html
Copyright © 2020-2023  润新知