• Java中的HashSet集合


    Set接口:  

                 Set接口是Collection接口的子类,其继承了所有方法,HashSet集合则实现了Set接口,其内部存储数据时依靠哈希表,一个类似数组和链表的结合体。设置空集合时,存在默认的容量和加载因子,再用HashSet对象调用add方法时,其实是先比较其Hash值,若是没有的话,则直接添加到集合中,若有的话,则再equals下比较其内容(因为有可能内容不一样,但是其Hash值一样),若是内容不一样,则在这个地址下添加(链式),若是一样的话,则丢掉。注意就保证了其的唯一性。(以后定义变量时,都需要重写其hashcode和equals方法)至于LinkedHashSet则在HashSet基础上保证了其的有序性(取出和存入顺序一样)。

    Set接口介绍:

    Set方法和Collection方法基本一致,通过元素的equals方法,来判断是否为重复元素。

    HashSet集合:

    此类实现Set接口,由哈希表支持(实际上是个HashMap集合,是数组和链表的结合体)。HashSet集合不能保证迭代顺序与元素的存储顺序相同。

    HashSet集合存储数据的结构:

    哈希表:

      哈希表底层,使用的也是数组机制数组中也存放对象,而这些对象往数组中存放时的位置比较特殊,当需要把这些对象给数组中存放时,那么会根据这些对象的特有数据结合相应的算法,计算出这个对象在数组中的位置,然后把这个对象存放在数组中。而这样的数组就称为哈希数组,即就是哈希表。

       public HashSet()

          构造一个新的空 set,其底层 HashMap 实例的默认初始容量是 16,加载因子是 0.75。

        (当容量到16*0.75时,会再开16个的容量)

      当向哈希表中存放元素时,需要根据元素的特有数据结合相应的算法,这个算法其实就是Object类中的hashCode方法。

    public int hashCode() {
            int h = hash;  //value是定义的字符数组 ,hash开始为0
            if (h == 0 && value.length > 0) {
                char val[] = value;
    
                for (int i = 0; i < value.length; i++) {
                    h = 31 * h + val[i];
                }
                hash = h;
            }
            return h;
        }

              由于任何对象都是Object类的子类,所以任何对象有拥有这个方法。即就是在给哈希表中存放对象时,会调用对象的hashCode方法,算出对象在表中的存放位置,这里需要注意,如果两个对象hashCode方法算出结果一样,这样现象称为哈希冲突,这时会调用对象的equals方法,比较这两个对象是不是同一个对象,如果equals方法返回的是true,那么就不会把第二个对象存放在哈希表中,如果返回的是false,就会把这个值存放在哈希表中。 

     总结:保证HashSet集合元素的唯一,其实就是根据对象的hashCode和equals方法来决定的。如果我们往集合中存放自定义的对象,那么保证其唯一,就必须复写hashCode和equals方法建立属于当前对象的比较方式。

    HashSet存储自定义类型元素:

      给HashSet中存放自定义类型元素时,需要重写对象中的hashCode和equals方法,建立自己的比较方式,才能保证HashSet集合中的对象唯一

    LinkedHashSet介绍:

      在HashSet下面有一个子类LinkedHashSet,它是链表和哈希表组合的一个数据存储结构,LinkedHashSet集合保证元素的存入和取出的顺序。

    HashSet的add 、contains等方法判断元素是否重复原理:

      Set集合不能存放重复元素,其添加方法在添加时会判断是否有重复元素,有重复不添加,没重复则添加。

      HashSet集合由于是无序的,其判断唯一的依据是元素类型的hashCode与equals方法的返回结果。规则如下:

      先判断新元素与集合内已经有的旧元素的HashCode值

    ①、 如果不同,说明是不同元素,添加到集合。

    ②、如果相同,再判断equals比较结果。返回true则相同元素;返回false则不同元素,添加到集合。

      所以,使用HashSet存储自定义类型,如果没有重写该类的hashCode与equals方法,则判断重复时,使用的是地址值,如果想通过内容比较元素是否相同,需要重写该元素类的hashcode与equals方法。

  • 相关阅读:
    ubuntu右上角时间不显示
    树、森林和二叉树之间的转换(转)
    机器学习——支持向量机(SVM)之拉格朗日乘子法,KKT条件以及简化版SMO算法分析
    Java数据结构——平衡二叉树的平衡因子(转自牛客网)
    机器学习——梯度下降算法
    ubuntu下gedit闪退,遇到问题:ERROR:../../gi/pygi-argument.c:1583:_pygi_argument_to_object: code should not be reached 已放弃 (核心已转储)
    机器学习——Logistic回归
    机器学习——基于概率论的分类方法:朴素贝叶斯
    ubuntu安装simplejson模块
    Java数据结构——树的三种存储结构
  • 原文地址:https://www.cnblogs.com/heitaitou/p/12878722.html
Copyright © 2020-2023  润新知