• Set集合


    Set接口是Collection接口的子接口,Set集合是无序的(但子类中有很多都是有序的),不能有重复的元素,如果用add()加入一个已有的元素,会添加失败,返回false。

    Set接口的继承关系:

    Set接口的常用实现类:

    1、HashSet

    • 按Hash算法来存储元素,具有良好的存储、查找性能。
    • 元素无序,就是说排列顺序和添加顺序可能不同
    • 不是同步的,如果多个线程同时访问、修改一个HashSet,必须要使用同步代码来保证同步。就是说HashSet不是线程安全的。
    • 元素的值可以是null

    HashSet添加元素(存储)的机制:

    先调用该元素的hashCode()方法获取hashCode值,根据hashCode值确定存储位置。

    如果该位置上没有元素,则说明HashSet集合中没有与之相同的元素,直接在该位置存储该元素。

    如果该位置已有元素,则使用equals()比较这两个元素,返回false则在此位置存储该元素(但这样会在一个位置存储多个元素,导致HashSet性能降低),返回true则添加失败,不存储此元素。

    hash,被翻译为哈希、散列。hash算法的价值在于速度,它能快速查找被检索的对象。查询某个元素时,根据hashCode值直接定位元素的存储位置,实现快速查找。如果在HashSet中有多个元素的hashCode相同(在一个位置存储了多个元素),会导致查找性能下降。

    为了保证HashSet的性能(一个位置只存储一个元素),我们需要重写元素所属类的hashCode()。

    重写规则:如果两个对象通过equals()返回true,则它们的hashCode()也应该相同。

    因为Java自带的类大多数都重写了Object的hashCode()方法,所以Java自带的类(包括String)、以及继承自这些类的自定义类一般都不必重写hashCode()。不会存入相同的元素,一个位置只存一个元素。

    如果要在HashSet中存储自定义的类(未继承自Java自带的类),则需要在定义该类时重写该类继承自Object的hashCode(),而重写hashCode(),又必须重写equals()。

    如果不重写,是可以存入该类相同的对象的(这里的相同是指对象本身相同、对象本身的存储地址可以不同)。注意HashSet存储的实际上是对象的引用。

    示例:

    1  HashSet hashSet=new HashSet();
    2         //Java自带的类,下面2个相同的String只会存入第一个。使用New String("ok")也一样
    3         hashSet.add("ok");
    4         hashSet.add("ok");
    1  HashSet hashSet=new HashSet();
    2         //这个自定义的类未重写hashCode()、equals()。下面2个相同的对象都会被存入
    3         hashSet.add(new MyClass("ok"));
    4         hashSet.add(new MyClass("ok"));

    重写示例:

     1 class MyClass{
     2     private String id;  //id唯一标识创建的实例
     3     private String name;
     4 
     5     public MyClass(String id,String name) {
     6         this.id = id;
     7         this.name = name;
     8     }
     9 
    10     //toString可以不重写,不强制要求
    11     @Override
    12     public String toString() {
    13         return id + ":" + name;
    14     }
    15 
    16     //重写hashCode(),返回唯一标识此对象的成员变量的hashCode
    17     @Override
    18     public int hashCode() {
    19         return id.hashCode();
    20     }
    21 
    22     //重写equals(),Object的equals()是根据对象地址来判断,我们重写的效果是要根据对象本身来判断
    23     @Override
    24     public boolean equals(Object object){
    25         if (this==object)   //判断是否是同一个对象
    26             return true;
    27         if (!(object instanceof MyClass))  //判断是否是此类的对象
    28             return false;  //如果不是,返回false
    29         //如果是此类的对象
    30         MyClass obj=(MyClass)object;   //强制类型转换
    31         boolean b=this.id.equals(obj.id);  //通过唯一标识对象的id来比较。成员变量id不一定要是单独的,可以是居民类的身份证号码、学生类的学号等。
    32         return b;
    33     }
    34 
    35     //可以自由添加其它的成员变量、方法
    36 
    37 }
    1  HashSet hashSet=new HashSet();
    2         //重写后只存入第一个
    3         hashSet.add(new MyClass("1","ok"));
    4         hashSet.add(new MyClass("1","ok"));

    HashSet是最常用的Set。

    LinkedHashSet类是HashSet的子类,具有HashSet的一切特性(依然不能有重复的元素),但其内部使用一个链表维持元素的插入顺序,就是说存取、查找时仍是按hashCode进行的,但同时维护了一个链表来保持元素的添加顺序,遍历LinkedHashSet时,根据链表依次访问(和存入的顺序相同)。

    因为维护了一个链表,存储、查找的性能略低于HashSet,但遍历时性能高于HashSet(根据链表进行遍历)。

    2、TreeSet

    Set接口有一个子接口SortedSet(有序的Set),TreeSet是SortedSet的一个实现类。

    TresSet类采用红黑树的数据结构来存储元素,元素是有序的,但并不是按存入顺序排序的,而是按炎元素的实际值排序的。

    TreeSet有2种排序方式:

    • 自然排序  这是TreeSet默认的排序方式。数值型按数值大小排列,字符按码值排列,Date、Time按时间戳的大小排列........默认升序。
    • 定制排序  按我们自定义的规则排序

    TreeSet具有父类的一切方法,还具有自身的一些方法:

    Object  first()   返回集合中的第一个元素

    Object last()    最后一个

    Object  lower(Object obj)   返回obj的前一个元素,默认自然排序(默认升序),所以是lower,略小于

    Object  higher(Object obj)  后一个

    SortedSet  subSet(Object start,Object end)   返回子集合

    SortedSet  headSet(Object end)   返回子集合

    SortedSet  tailSet(Object start)

    java中,一个区间,[a,b),都是包含前者,不包含后者。

    3、EnumSet

    EnumSet是专门为枚举类设计的集合类,EnumSet的所有元素都必须是某个枚举类的某个枚举值。必须要是同一个枚举类的。

    EnumSet是有序的,根据该枚举值在枚举类中的定义顺序来决定在EnumSet中的顺序。

    性能比较:

    TreeSet性能最好,因为不需要维持什么,没有其他开销。但应用不广泛,只能用于枚举类的枚举值。

    HashSet次之,尤其是存储(添加)、查找性能很高。

    TreeSet性能最差,因为要使用红黑树算法来维护集合的元素顺序。

    HashSet有一个子类:LinkedHashSet。

    存储(添加)、查找操作,HashSet性能要高于LinkedHashSet,因为LinkedHashSet内部要维护一个链表,有额外的开销。

    但正是由于链表,遍历集合时,LinkedHashSet要快于HashSet。

    Set的三个实现类:HashSet、TreeSet、EnumSet都不是线程安全的。

    当一个以上的线程访问、修改同一个Set集合时,需要手动同步该Set集合。

    通常可通过Collections工具类的静态方法synchronizedXxx()来同步集合。

  • 相关阅读:
    BZOJ3790 神奇项链
    Tarjan求Lca
    Manacher算法--Poj3974
    [Usaco2015 Feb]Censoring
    扩展Kmp
    Ural1297 最长回文串
    [Usaco2007 Dec] 队列变换
    Pku2774 最长公共子串
    Spoj 694 Distinct Substrings
    Pku1734 Musical Theme 不可重叠最长重复子
  • 原文地址:https://www.cnblogs.com/chy18883701161/p/10890247.html
Copyright © 2020-2023  润新知