Java中的HashSet集合

Java中的HashSet集合
Set接口：

Set接口是Collection接口的子类，其继承了所有方法，HashSet集合则实现了Set接口，其内部存储数据时依靠哈希表，一个类似数组和链表的结合体。设置空集合时，存在默认的容量和加载因子，再用HashSet对象调用add方法时，其实是先比较其Hash值，若是没有的话，则直接添加到集合中，若有的话，则再equals下比较其内容（因为有可能内容不一样，但是其Hash值一样），若是内容不一样，则在这个地址下添加（链式），若是一样的话，则丢掉。注意就保证了其的唯一性。（以后定义变量时，都需要重写其hashcode和equals方法）至于LinkedHashSet则在HashSet基础上保证了其的有序性（取出和存入顺序一样）。

Set接口介绍：

Set方法和Collection方法基本一致，通过元素的equals方法，来判断是否为重复元素。

HashSet集合：

此类实现Set接口，由哈希表支持（实际上是个HashMap集合，是数组和链表的结合体）。HashSet集合不能保证迭代顺序与元素的存储顺序相同。

HashSet集合存储数据的结构：

哈希表：

　　哈希表底层，使用的也是数组机制数组中也存放对象，而这些对象往数组中存放时的位置比较特殊，当需要把这些对象给数组中存放时，那么会根据这些对象的特有数据结合相应的算法，计算出这个对象在数组中的位置，然后把这个对象存放在数组中。而这样的数组就称为哈希数组，即就是哈希表。

　　 public HashSet()

　　　　　　构造一个新的空 set，其底层 HashMap 实例的默认初始容量是 16，加载因子是 0.75。

　　　　（当容量到16*0.75时，会再开16个的容量）

　　当向哈希表中存放元素时，需要根据元素的特有数据结合相应的算法，这个算法其实就是Object类中的hashCode方法。
```
public int hashCode() {
        int h = hash;  //value是定义的字符数组 ，hash开始为0
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }
```
由于任何对象都是Object类的子类，所以任何对象有拥有这个方法。即就是在给哈希表中存放对象时，会调用对象的hashCode方法，算出对象在表中的存放位置，这里需要注意，如果两个对象hashCode方法算出结果一样，这样现象称为哈希冲突，这时会调用对象的equals方法，比较这两个对象是不是同一个对象，如果equals方法返回的是true，那么就不会把第二个对象存放在哈希表中，如果返回的是false，就会把这个值存放在哈希表中。

　总结：保证HashSet集合元素的唯一，其实就是根据对象的hashCode和equals方法来决定的。如果我们往集合中存放自定义的对象，那么保证其唯一，就必须复写hashCode和equals方法建立属于当前对象的比较方式。

HashSet存储自定义类型元素：

　　给HashSet中存放自定义类型元素时，需要重写对象中的hashCode和equals方法，建立自己的比较方式，才能保证HashSet集合中的对象唯一

LinkedHashSet介绍：

　　在HashSet下面有一个子类LinkedHashSet，它是链表和哈希表组合的一个数据存储结构，LinkedHashSet集合保证元素的存入和取出的顺序。

HashSet的add 、contains等方法判断元素是否重复原理：

　　Set集合不能存放重复元素，其添加方法在添加时会判断是否有重复元素，有重复不添加，没重复则添加。

　　HashSet集合由于是无序的，其判断唯一的依据是元素类型的hashCode与equals方法的返回结果。规则如下：

　　先判断新元素与集合内已经有的旧元素的HashCode值

①、如果不同，说明是不同元素，添加到集合。

②、如果相同，再判断equals比较结果。返回true则相同元素；返回false则不同元素，添加到集合。

　　所以，使用HashSet存储自定义类型，如果没有重写该类的hashCode与equals方法，则判断重复时，使用的是地址值，如果想通过内容比较元素是否相同，需要重写该元素类的hashcode与equals方法。
相关阅读:
ubuntu右上角时间不显示
 树、森林和二叉树之间的转换（转）
机器学习——支持向量机(SVM)之拉格朗日乘子法，KKT条件以及简化版SMO算法分析
 Java数据结构——平衡二叉树的平衡因子（转自牛客网）
机器学习——梯度下降算法
 ubuntu下gedit闪退，遇到问题：ERROR:../../gi/pygi-argument.c:1583:_pygi_argument_to_object: code should not be reached 已放弃 (核心已转储)
机器学习——Logistic回归
 机器学习——基于概率论的分类方法：朴素贝叶斯
 ubuntu安装simplejson模块
 Java数据结构——树的三种存储结构
原文地址：https://www.cnblogs.com/heitaitou/p/12878722.html

Java中的HashSet集合

Set接口：

Set接口介绍：

HashSet集合：

HashSet集合存储数据的结构：

哈希表：

HashSet存储自定义类型元素：

LinkedHashSet介绍：

HashSet的add 、contains等方法判断元素是否重复原理：