• Java集合框架总结(2)——Set接口的使用


    1、Set接口的使用

        Set集合里多个对象之间没有明显的顺序。具体详细方法请参考API文档(可见身边随时带上API文档有多重要),基本与Collection方法相同。只是行为不同(Set不允许包含重复元素)。

          Set集合不允许重复元素,是因为Set判断两个对象相同不是使用==运算符,而是根据equals方法。即两个对象用equals方法比较返回true,Set就不能接受两个对象。

    01 public class TestSet
    02 {
    03     public static void main(String[] args)
    04     {
    05         Set<String> books = new HashSet<String>();
    06          
    07         //添加一个字符串对象
    08         books.add(new String("Struts2权威指南"));
    09          
    10         //再次添加一个字符串对象,
    11         //因为两个字符串对象通过equals方法比较相等,所以添加失败,返回false
    12         boolean result = books.add(new String("Struts2权威指南"));
    13          
    14         System.out.println(result);
    15          
    16         //下面输出看到集合只有一个元素
    17         System.out.println(books); 
    18     }
    19 }

       程序运行结果:

    false 
    [Struts2权威指南]

            说明:程序中,book集合两次添加的字符串对象明显不是一个对象(程序通过new关键字来创建字符串对象),当使用==运算符判断返回false,使用equals方法比较返回true,所以不能添加到Set集合中,最后只能输出一个元素。

            Set接口中的知识,同时也适用于HashSetTreeSetEnumSet三个实现类。

     

     

     

    2、HashSet类

              HashSet按Hash算法来存储集合的元素,因此具有很好的存取和查找性能。

              HashSet的特点:

    (1)HashSet不是同步的,多个线程访问是需要通过代码保证同步 

    (2)集合元素值可以使null。

           HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等,并且两个对象的hashCode()方法返回值也相等

    01 //类A的equals方法总是返回true,但没有重写其hashCode()方法
    02 class A
    03 {
    04     public boolean equals(Object obj)
    05     {
    06         return true;
    07     }
    08 }
    09 //类B的hashCode()方法总是返回1,但没有重写其equals()方法
    10 class B
    11 {
    12     public int hashCode()
    13     {
    14         return 1;
    15     }
    16 }
    17 //类C的hashCode()方法总是返回2,并重写其equals()方法
    18 class C
    19 {
    20     public int hashCode()
    21     {
    22         return 2;
    23     }
    24     public boolean equals(Object obj)
    25     {
    26         return true;
    27     }
    28 }
    29 public class TestHashSet
    30 {
    31     public static void main(String[] args)
    32     {
    33         HashSet<Object> books = new HashSet<Object>();
    34         //分别向books集合中添加2个A对象,2个B对象,2个C对象
    35         books.add(new A());
    36         books.add(new A());
    37         books.add(new B());
    38         books.add(new B());
    39         books.add(new C());
    40         books.add(new C());
    41         System.out.println(books);
    42     }
    43 }



    程序运行结果:

    [B@1 ,  B@1  C@2  A@b5dac4  A@9945ce]

               

    说明:

    (1)Object类提供的toString方法总是返回该对象实现类的类名+@+hashCode(16进制数)值,所以可以看到上面程序输出的结果。可以通过重写toString方法来输出自己希望的形式。

    (2)即使2个A对象通过equals比较返回true,但HashSet依然把它们当成2个对象;即使2个B对象的hashCode()返回相同值,但HashSet依然把它们当成2个对象。即如果把一个对象放入HashSet中时,如果重写该对象equals()方法,也应该重写其hashCode()方法。其规则是:如果2个对象通过equals方法比较返回true时,这两个对象的hashCode也应该相同。

    hash算法的功能

    它能保证通过一个对象快速查找到另一个对象。hash算法的价值在于速度,它可以保证查询得到快速执行。

    当需要查询集合中某个元素时,hash算法可以直接根据该元素的值得到该元素保存位置,从而可以让程序快速找到该元素。

    当从HashSet中访问元素时,HashSet先计算该元素的hashCode值(也就是调用该对象的hashCode())方法的返回值),然后直接到该hashCode对应的位置去取出该元素。

    即也是快速的原因。HashSet中每个能存储元素的“曹位(slot)”通常称为“桶(bucket)”,如果多个元素的hashCode相同,但它们通过equals()方法比较返回false,就需要一个“桶”里放多个元素,从而导致性能下降。

    继续深入研究HashSet:

              当向HashSet中添加一个可变对象后,并且后面程序修改了该可变对象的属性,可能导致它与集合中其他元素相同,这就可能导致HashSet中包含两个相同的对象。

    看下面程序:

    01 class R
    02 {
    03     int count;
    04     public R(int count)
    05     {
    06         this.count = count;
    07     }
    08     public String toString()
    09     {
    10         return "R(count属性:" + count + ")";
    11     }
    12     public boolean equals(Object obj)
    13     {
    14         if (obj instanceof R)
    15         {
    16             R r = (R)obj;
    17             if (r.count == this.count)
    18             {
    19                 return true;
    20             }
    21         }
    22         return false;
    23     }
    24     public int hashCode()
    25     {
    26         return this.count;
    27     }
    28 }
    29 public class TestHashSet2
    30 {
    31     public static void main(String[] args)
    32     {
    33         HashSet<R> hs = new HashSet<R>();
    34         hs.add(new R(5));
    35         hs.add(new R(-3));
    36         hs.add(new R(9));
    37         hs.add(new R(-2));
    38         //打印HashSet集合,集合元素是有序排列的
    39         System.out.println(hs);
    40         //取出第一个元素
    41         Iterator<R> it = hs.iterator();
    42         R first = (R)it.next();     //first指向集合的第一个元素
    43         //为第一个元素的count属性赋值
    44         first.count = -3;           //first指向的元素值发生改变,地址并没有改变,大家可以试着用Java内存分配机制(栈和堆)思考下。
    45         //再次输出count将看到HashSet里的元素处于无序状态
    46         System.out.println(hs);
    47         hs.remove(new R(-3));
    48         System.out.println(hs);
    49         //输出false
    50         System.out.println("hs是否包含count为-3的R对象?" + hs.contains(new R(-3)));
    51         //输出false
    52         System.out.println("hs是否包含count为5的R对象?" + hs.contains(new R(5)));
    53  
    54     }
    55 }


    程序运行结果:

    [R(count属性:5), R(count属性:9), R(count属性:-3), R(count属性:-2)] 
    [R(count属性:-3), R(count属性:9), R(count属性:-3), R(count属性:-2)] 
    [R(count属性:-3), R(count属性:9), R(count属性:-2)] 
    hs是否包含count为-3的R对象?false 
    hs是否包含count为5的R对象?false

           说明:程序重写了R类的equals()和hashCode()方法,这两个方法都是根据R对象的count属性来判断。从运行结果可以看出,HashSet集合中有完全相同元素,这表明两个元素已经重复,但因为HashSet在添加它们时已经把它们添加到了不同地方,所以HashSet完全可以容纳两个相同元素。至于第一个count为-3的R对象,它保存在count为5的R对象对应的位置(地址)。当向HashSet中添加可变对象时,必须十分小心。如果修改HashSet集合中的对象,有可能导致该对象与集合中其他对象相等,从而导致HashSet无法准确访问该对象。

           HashSet还有一个子类LinkedHashSet,LinkedHashSet集合也根据元素hashCode值来决定元素存储位置,但它同时使用链表维护元素的次序,即当遍历LinkedHashSet集合元素时,HashSet将会按元素的添加顺序来访问集合里的元素。

    3、TreeSet类

           TreeSet是SortedSet接口的唯一实现,TreeSet可以确保集合元素处于排序状态(元素是有序的)。

           TreeSet提供的几个额外方法:

         TreeSet提供的几个额外方法:

    Comparator comparator(): 返回当前Set使用的Comparator,或者返回null,表示以自然方式排序。

    Object first():返回集合中的第一个元素。

    Object last():返回集合中的最后一个元素。

    Objiect lower(Object e):返回集合中位于指定元素之前的元素(即小于指定元素的最大元素,参考元素可以不是TreeSet的元素)。

    Object higher(Object e):返回集合中位于指定元素之后的元素(即大于指定元素的最小元素,参考元素可以不需要TreeSet的元素)。

    SortedSet subSet(fromElement, toElement):返回此Set的子集,范围从fromElement(包含大于等于)到toElement(不包含小于)。

    SortedSet headSet(toElement):返回此Set的子集,由小于toElement的元素组成。

    SortedSet tailSet(fromElement):返回此Set的子集,由大于或等于fromElement的元素组成。

    01 public class TestTreeSetCommon
    02 {
    03     public static void main(String[] args)
    04     {
    05         TreeSet<Integer> nums = new TreeSet<Integer>();
    06         //向TreeSet中添加四个Integer对象
    07         nums.add(5);
    08         nums.add(2);
    09         nums.add(10);
    10         nums.add(-9);
    11         //输出集合元素,看到集合元素已经处于排序状态
    12         System.out.println(nums);
    13         //输出集合里的第一个元素
    14         System.out.println(nums.first());
    15         //输出集合里的最后一个元素
    16         System.out.println(nums.last());
    17         //返回小于4的子集,不包含4
    18         System.out.println(nums.headSet(4));
    19         //返回大于5的子集,如果Set中包含5,子集中还包含5
    20         System.out.println(nums.tailSet(5));
    21         //返回大于等于-3,小于4的子集。
    22         System.out.println(nums.subSet(-3 4));
    23     }
    24 }


    程序运行结果:

    [-9, 2, 5, 10] 
    -9 
    10 
    [-9, 2] 
    [5, 10] 
    [2]

  • 相关阅读:
    字体
    abstract关键词
    final关键词
    多态
    接口
    java面向对象
    java运算符
    JDK安装
    循环
    TextView控件
  • 原文地址:https://www.cnblogs.com/chenying99/p/3120339.html
Copyright © 2020-2023  润新知