• JAVA中重写equals()方法为什么要重写hashcode()方法?


    object对象中的 public boolean equals(Object obj),对于任何非空引用值 x 和 y,当且仅当 x 和 y 引用同一个对象时,此方法才返回 true;
    注意:当此方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。如下:
    (1)当obj1.equals(obj2)为true时,obj1.hashCode() == obj2.hashCode()必须为true 
    (2)当obj1.hashCode() == obj2.hashCode()为false时,obj1.equals(obj2)必须为false
    如果不重写equals,那么比较的将是对象的引用是否指向同一块内存地址,重写之后目的是为了比较两个对象的value值是否相等。特别指出利用equals比较八大包装对象
    (如int,float等)和String类(因为该类已重写了equals和hashcode方法)对象时,默认比较的是值,在比较其它自定义对象时都是比较的引用地址
    hashcode是用于散列数据的快速存取,如利用HashSet/HashMap/Hashtable类来存储数据时,都是根据存储对象的hashcode值来进行判断是否相同的。
    这样如果我们对一个对象重写了euqals,意思是只要对象的成员变量值都相等那么euqals就等于true,但不重写hashcode,那么我们再new一个新的对象,
    当原对象.equals(新对象)等于true时,两者的hashcode却是不一样的,由此将产生了理解的不一致,如在存储散列集合时(如Set类),将会存储了两个值一样的对象,
    导致混淆,因此,就也需要重写hashcode()
    举例说明:

    [java] view plaincopy
     
     
    1. import java.util.*;  
    2.   
    3. public class HelloWorld {  
    4.     public static void main(String[] args) {  
    5.         /* 
    6.         Collection c = new HashSet(); 
    7.         c.add("hello"); 
    8.         c.add(new Name("f1","l1")); 
    9.         c.add(new Integer(100)); 
    10.         c.remove("hello");  
    11.         c.remove(new Integer(100)); 
    12.         System.out.println(c.remove(new Name("f1","l1"))); 
    13.         */  
    14.         Name n1 = new Name("01");  
    15.         Name n2 = new Name("01");  
    16.           
    17.         Collection c = new HashSet();  
    18.         c.add(n1);  
    19.         System.out.println("------------");  
    20.         c.add(n2);  
    21.         System.out.println("------------");  
    22.         System.out.println(n1.equals(n2));  
    23.         System.out.println("------------");  
    24.         System.out.println(n1.hashCode());  
    25.         System.out.println(n2.hashCode());  
    26.         System.out.println(c);  
    27.     }  
    28.   
    29.   
    30. }  
    31.   
    32. class Name {  
    33.     private String id;  
    34.     public Name(String id) {  
    35.         this.id = id;   
    36.     }  
    37.       
    38.     public String toString(){  
    39.         return this.id;  
    40.     }  
    41.     public boolean equals(Object obj) {  
    42.         if (obj instanceof Name) {  
    43.             Name name = (Name) obj;  
    44.             System.out.println("equal"+ name.id);  
    45.             return (id.equals(name.id));  
    46.         }  
    47.         return super.equals(obj);  
    48.     }  
    49.           
    50.     public int hashCode() {  
    51.         Name name = (Name) this;  
    52.         System.out.println("Hash" + name.id);  
    53.         return id.hashCode();  
    54.               
    55.     }  
    56. }  


    就这个程序进行分析,在第一次添加时,调用了hashcode()方法,将hashcode存入对象中,第二次也一样,然后对hashcode进行比较。hashcode也只用于HashSet/HashMap/Hashtable类存储数据,所以会用于比较,需要重写

    总结,自定义类要重写equals方法来进行等值比较,自定义类要重写compareTo方法来进行不同对象大小的比较,重写hashcode方法为了将数据存入HashSet/HashMap/Hashtable类时进行比较

    一般来说,如果你要把一个类的对象放入容器中,那么通常要为其重写equals()方法,让他们比较地址值而不是内容值。特别地,如果要把你的类的对象放入散列中,那么还要重写hashCode()方法;要放到有序容器中,还要重写compareTo()方法。
    equals()相等的两个对象,hashcode()一定相等;
    equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。换句话说,equals()方法不相等的两个对象,hashcode()有可能相等。(我的理解是由于哈希码在生成的时候产生冲突造成的)。
    反过来:hashcode()不等,一定能推出equals()也不等;hashcode()相等,equals()可能相等,也可能不等

    Hash

    先用一张图看下什么是Hash

    Hash是散列的意思,就是把任意长度的输入,通过散列算法变换成固定长度的输出,该输出就是散列值。关于散列值,有以下几个关键结论:

    1、如果散列表中存在和散列原始输入K相等的记录,那么K必定在f(K)的存储位置上

    2、不同关键字经过散列算法变换后可能得到同一个散列地址,这种现象称为碰撞

    3、如果两个Hash值不同(前提是同一Hash算法),那么这两个Hash值对应的原始输入必定不同

    HashCode

    然后讲下什么是HashCode,总结几个关键点:

    1、HashCode的存在主要是为了查找的快捷性,HashCode是用来在散列存储结构中确定对象的存储地址的

    2、如果两个对象equals相等,那么这两个对象的HashCode一定也相同

    3、如果对象的equals方法被重写,那么对象的HashCode方法也尽量重写

    4、如果两个对象的HashCode相同,不代表两个对象就相同,只能说明这两个对象在散列存储结构中,存放于同一个位置

    HashCode有什么用

    回到最关键的问题,HashCode有什么用?不妨举个例子:

    1、假设内存中有0 1 2 3 4 5 6 7 8这8个位置,如果我有个字段叫做ID,那么我要把这个字段存放在以上8个位置之一,如果不用HashCode而任意存放,那么当查找时就需要到8个位置中去挨个查找

    2、使用HashCode则效率会快很多,把ID的HashCode%8,然后把ID存放在取得余数的那个位置,然后每次查找该类的时候都可以通过ID的HashCode%8求余数直接找到存放的位置了

    3、如果ID的 HashCode%8算出来的位置上本身已经有数据了怎么办?这就取决于算法的实现了,比如ThreadLocal中的做法就是从算出来的位置向后查找第 一个为空的位置,放置数据;HashMap的做法就是通过链式结构连起来。反正,只要保证放的时候和取的时候的算法一致就行了。

    4、如果ID的 HashCode%8相等怎么办(这种对应的是第三点说的链式结构的场景)?这时候就需要定义equals了。先通过HashCode%8来判断类在哪一 个位置,再通过equals来在这个位置上寻找需要的类。对比两个类的时候也差不多,先通过HashCode比较,假如HashCode相等再判断 equals。如果两个类的HashCode都不相同,那么这两个类必定是不同的

    举个实际的例子Set。我们知道Set里面的元素是不可以重复的,那么如何做到?Set是根据equals()方法来判断两个元素是否相等的。比方 说Set里面已经有1000个元素了,那么第1001个元素进来的时候,最多可能调用1000次equals方法,如果equals方法写得复杂,对比的 东西特别多,那么效率会大大降低。使用HashCode就不一样了,比方说HashSet,底层是基于HashMap实现的,先通过HashCode取一 个模,这样一下子就固定到某个位置了,如果这个位置上没有元素,那么就可以肯定HashSet中必定没有和新添加的元素equals的元素,就可以直接存 放了,都不需要比较;如果这个位置上有元素了,逐一比较,比较的时候先比较HashCode,HashCode都不同接下去都不用比了,肯定不一 样,HashCode相等,再equals比较,没有相同的元素就存,有相同的元素就不存。如果原来的Set里面有相同的元素,只要HashCode的生 成方式定义得好(不重复),不管Set里面原来有多少元素,只需要执行一次的equals就可以了。这样一来,实际调用equals方法的次数大大降低, 提高了效率。

  • 相关阅读:
    堆栈的分布
    Socket网络编程(TCP/IP/端口/类)和实例
    c语言字节对齐
    理一理字节对齐的那些事
    Socket网络编程(TCP/IP/端口/类)和实例
    socket、端口、进程的关系
    SMT32 启动文件详细解说
    Chapter 1 First Sight——22
    Leetcode389
    Chapter 1 First Sight——21
  • 原文地址:https://www.cnblogs.com/111testing/p/7062310.html
Copyright © 2020-2023  润新知